Apache Hadoop คืออะไร

Apache Hadoop เป็นชื่อของชุดข้อมูลขนาดใหญ่อัลกอริธึมการจัดเก็บแบบกระจายและซอฟต์แวร์ประมวลผลแบบกระจายที่สร้างขึ้นโดยมูลนิธิซอฟต์แวร์ Apache มันถูกออกแบบมาเพื่อรองรับการใช้งานบริการข้อมูลปริมาณสูง จัดการกับความล้มเหลวของฮาร์ดแวร์โดยอัตโนมัติโดยไม่สูญเสียบริการ

Hadoop ใช้ระบบไฟล์แบบกระจายที่เรียกว่า HDFS และซอฟต์แวร์สำหรับการประมวลผลชุดข้อมูลขนาดใหญ่ที่เรียกว่า MapReduce ไฟล์ที่มีขนาดใหญ่มากจะแบ่งออกเป็นชิ้น ๆ โดยทั่วไปจะมีขนาด 64 หรือ 128 MB ซอฟต์แวร์ส่วนใหญ่เขียนด้วยภาษาจาวาโดยมีรหัสระดับล่างเขียนเป็นภาษาซี

เซิร์ฟเวอร์ Apache, ข้อมูลขนาดใหญ่, บริการ, ข้อกำหนดของซอฟต์แวร์