hadoop三大组件:Client、Master、Slave。Hadoop集群可以定义为一种特殊类型的计算集群,旨在用于分布式计算环境中存储和分析大量非结构化数据。这样的集群可以在低成本计算机上的Hadoop开源分布式处理软件上运行Hadoop集群架构。
Client:
它既不是主设备也不是从设备,客户端的工作是提交MapReduce作业,以描述应如何处理数据的方式,然后在完成作业后检索数据以了解响应。
Masters:
Master由3个组件组成,即NameNode,Secondary Node Name和Job Tracker。
Slaves:
从节点是Hadoop群集中的大多数计算机,并负责存储数据和处理计算。
Hadoop集群以提高数据分析应用程序的速度及其可伸缩性而被应用,Hadoop集群具有很高的抗故障能力,因为每个数据块都复制到其他节点上,以确保在单个节点发生故障时不会丢失数据。