HADOOP LÀ GÌ

  -  

Apabịt Hadoop là 1 trong những nền tảng gốc rễ mượt mã nguồn msinh sống, miễn chi phí, dựa vào Java, cung cấp 1 gốc rễ phân tán dũng mạnh để tàng trữ cùng cai quản big data. Bản quyền Apađậy V2 license. Nó chạy vận dụng bên trên những các Hartware Khủng cùng xử trí hàng chục ngàn terabytes dữ liệu bên trên hàng ngàn nodes. Hadoop đem cảm xúc từ bỏ Google MapReduce cùng Google File System (GFS). Điểm mạnh của nền tảng Hadoop là hỗ trợ độ tin cậy và tính sẵn sàng chuẩn bị cao.

Bạn đang xem: Hadoop là gì

Các nhân tố lõi của Hadoop là gì?

Có nhì nhân tố bao gồm của gốc rễ Hadoop.

Hadoop MapReduce là biện pháp phân chia 1 vấn đề dữ liệu to hơn thành các đoạn nhỏ hơn cùng phân tán nó bên trên những máy chủ. Mỗi sever có 1 tập tài nguyên ổn riêng rẽ và máy chủ cách xử lý dữ liệu bên trên cục bộ. khi sever cách xử trí ngừng dữ liệu, chúng sẽ gởi trngơi nghỉ về sever bao gồm.Hadoop Distributed File System (HDFS) là hệ thống tập tin ảo. Có 1 sự khác hoàn toàn phệ thân các hệ thống tập tin không giống với Hadoop. Khi bọn họ di chuyển 1 tập tin ở HDFS, nó tự động hóa tạo thành các mhình ảnh nhỏ dại. Các đoạn nhỏ của tập tin sẽ tiến hành nhân rộng lớn cùng lưu trữ trên nhiều sever khác (thường xuyên là 3) nhằm tăng sức Chịu đựng lỗi với tính chuẩn bị cao.

Bên cạnh 2 nguyên tố lõi, Hadoop cũng đựng 1 số modules:

Hadoop Common: những nhân thể tích phổ cập cho các module không giống của Hadoop.

Xem thêm: So Sánh Máy Ảnh Crop Là Gì Trong Tiếng Anh? Nghĩa Của Từ Crop

Hadoop Yarn: một nền tảng mang đến lập kế hoạch với làm chủ tài nguim nhiều (cluster).

Kiến trúc nhiều Hadoop những node

Xem tổng quan tiền bản vẽ xây dựng 1 cụm Hadoop các node.


*

*

Một cụm Hadoop nhỏ tuổi bao gồm một master node với nhiều worker / slave node. Nlỗi sẽ nói, cục bộ các đựng 2 lớp. Một lớp MapReduce Layer cùng lớp tê là HDFS Layer. Mỗi lớp bao gồm các nguyên tố tương quan riêng. Master node có JobTracker, TaskTracker, NameNode, và DataNode. Slave sầu / worker node gồm DataNode, cùng TaskTracker. Cũng có thể slave sầu / worker node chỉ cần tài liệu hoặc node nhằm tính toán.

Xem thêm: Ưu Điểm Của Ddc Là Gì ? Lập Trình Điều Khiển Ddc

Tại sao cần sử dụng Hadoop?

Các điểm tiện lợi khi dùng Hadoop:

Robus và Scalable — Có thể thêm node mới và chuyển đổi chúng Lúc cần.Affordable và Cost Effective sầu — Không buộc phải Hartware quan trọng để chạy Hadoop.Adaptive sầu & Flexible — Hadoop được chế tạo cùng với tiêu chí xử lý dữ liệu bao gồm cấu trúc và không kết cấu.Highly Available và Fault Tolerant — Lúc 1 node lỗi, nền tảng gốc rễ Hadoop tự động đưa sang node không giống.