发布于 2016-05-09 12:05:09 | 146 次阅读 | 评论: 0 | 来源: 网友投递
Hadoop分布式系统
一个分布式系统基础架构,由Apache基金会所开发。
用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
Linux环境:CentOs6.4
Hadoop版本:Hadoop-1.1.2
master: 192.168.1.241 NameNode JobTracker DataNode TaskTracker
slave:192.168.1.242 DataNode TaskTracker
内容:想hadoop文件系统中上传一个大文件,验证文件分别分布在192.168.1.241节点和192.168.1.242节点上。
第一步: 前期工作:搭建Hadoop集群,
在hdfs-site.xml中的配置为2.
运行执行start-all.sh命令,运行结果如图所示:
查看9000和9001的信息
9000是HDFS的入口9001是MapReduce的JobTracker的入口
从以上图中可以确定Ip地址为192.168.1.241.
第二步:通过网页查看节点的个数。在浏览器中输入http://localhost:50070
以上看到LiveNodes的个数为2,说明启动成功。
第三步:上传大文件。具体步骤如图所示:
通过网页查看运行状况:
大文件已经上传成功.文件的大小是244.91MBlock的大小是64M。所以每个节点能够有4个Block。
Replication为2,表明每个Block有2个备份。
查看节点的使用情况:
从图中可以看出,此文件分成了4个Block。(TotalNumberofblocks:4)。
每个Block在两个节点上进行了备份,分别是192.168.1.241192.168.1.242
hadoop集群至此测试结束。测试成功。