![大数据技术入门(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/475/34752475/b_34752475.jpg)
上QQ阅读APP看书,第一时间看更新
2.9 AWS云平台上安装Hadoop
安装Hadoop的最简单的方法就是使用云平台(例如AWS)的Hadoop服务。EMR是AWS的Hadoop服务。下面阐述安装和配置EMR的步骤。从服务菜单中选择EMR,点击“create cluster”,如图2-27所示,填入集群名字,选择要安装的Hadoop的各个组件。我们选择了Hadoop和Spark。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P67_3959.jpg?sign=1739282902-YA5VE6pfFC2pOqVs0TClrCyZ7qc7QyAY-0-597b6c48751381093bab9eca02c7bd97)
图2-27 创建Hadoop集群
如图2-28所示,指定Hadoop集群的硬件设置。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4004.jpg?sign=1739282902-i86TwqIwYijW102g004JsKFzhkPYS0V3-0-ca650fce42cf4028e24650ef3c8929c8)
图2-28 硬件配置
设置Hadoop集群的网络和安全设置。单击如图2-29所示的安全组的配置,就出现如图2-30所示的设置。然后,使用SSH登录到AWS的Master节点,就会出现如图2-31所示的界面,而后就可以输入Spark命令。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4005.jpg?sign=1739282902-Y5SpoeHdiB6qfnUDWS7FPsKnLBDFlqYy-0-eaa5fd9920309e678f44aaedb48a71c8)
图2-29 网络和安全设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4006.jpg?sign=1739282902-WMYIkJrltd3TuO61EF7mW9ykwyJfYvrp-0-3278fe126c91bb5cd48bc3ba7790656a)
图2-30 安全组设置
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P68_4007.jpg?sign=1739282902-6bFnwKKta9gfpllsMVpw6BQporMYQJPD-0-cbe4cefe5b8a377e6c9e11cfdf6b70e2)
图2-31 Spark界面
除了使用SSH来操作Hadoop集群和Spark之外,还可以在如图2-32所示的界面中启动Zeppelin,随后就会出现如图2-33所示的界面。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4051.jpg?sign=1739282902-a5fWY2s0gpEs2wms55yVVHduiH3KfsrP-0-c0b837a26f0696c6d183bf176e91394b)
图2-32 集群
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4052.jpg?sign=1739282902-do9xCdXQyLkLJ9YIDMFnS3PysQJJh93p-0-1cad09756c57afdec9c1ee6da05065d5)
图2-33 Zeppelin
之后,就可以输入Spark语句来操作集群上的数据(见图2-34,),查看日志信息(见图2-35)。
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4053.jpg?sign=1739282902-PLzfMFNNdOY04yhipS1n9JdzkNO7ked1-0-ded0b2dc076aa2ce5718e8e52122dac3)
图2-34 Spark操作
![](https://epubservercos.yuewen.com/EA5FDB/18562449008361506/epubprivate/OEBPS/Images/Figure-P69_4054.jpg?sign=1739282902-7StQalneGOeGl46spwp6mON0WbmqEFDg-0-81fc0c0b2ad013c67f24ce6bcf919ff5)
图2-35 查看日志