阿里云服务器搭建hadoop集群补充

softyun3年前云服务器88

1 阿里云服务器选配

首先附上官网链接:阿里云官网


点击上边链接,注册后登陆官网,选择产品选项,然后选择云服务器ECS,就进入云服务器ECS购买界面。

进入云服务ECS购买界面,点击立即购买,在界面中分为一键购买自定义购买,如何对配置没有概念,感觉太麻烦,推荐使用一键购买。本文以一键购买为例,主要是从以下几个方面进行选购:


地域及可用性实例规格镜像网络类型(公网带宽)购买数量(购买时长)


地域及可用性:选择离自己比较近的地域,如我在上海,选择华东2(上海),搭建hadoop集群的时候,购买的多台服务器一定要选择在同一个区域,避免后续配置麻烦。


实例规格: 选择CPU,及CPU运行内存,搭建hadoop集群的时候,master主机的运行内存必须是2G以上,其他节点可以为1G。我选购的3台云服务器的配置为:master:1 vCPU 2GiB,slave1:1 vCPU 1GiB,slave2:1 vCPU 1GiB。


镜像:选择服务器的系统和系统版本,系统可以选择CentOS和Ubuntu,版本无要求,我选择是 CentOS 8.0 64位。
网络类型(公网带宽):选择带宽,1-200Mbps都可以选择,我选择是1Mbps。


-购买数量(购买时长):选择购买数量和购买时长之后,付完款,就可以登陆了。配置越高费用越高。我选择的最低配置一个月:60元。


购买完成后,进入实例。选择远程登陆,输入自己的密码,即可进入系统。进入为命令行模式(黑窗口),不是图形化界面。登陆云服务器的方法,可以通过官网登陆,也可以通过SecureCRT或者Xshell等软件进行登陆,输入的IP地址(外网IP地址)和密码即可。


官网上的一个活动,有想法的可以参与一下。
阿里云大礼包领取


2 使用WEB界面访问hadoop集群

使用WEB界面访问HDFS和Yarn,该端口分别为50070和18088,这两个端口在这个文件中hdfs-site.xml、yarn-site.xml设置的。忘记的可以参考上一篇文章:阿里云搭建hadoop集群


使用WEB界面访问HDFS和Yarn的两个条件:


关闭防火墙云服务器安全组配置端口

关闭防火墙命令



1
2
3
4
5
6
7
8
9
10
11
12
13
#查看防火墙开启状态
systemctl status firewalld
#关闭防火墙
systemctl stop firewalld
#禁止开机启动防火墙
systemctl disable firewalld
#开启防火墙
systemctl start firewalld
#设置开机启动防火墙
systemctl enable firewalld
#重启防火墙
systemctl restart firewalld
123456789101112




云服务器安全组配置端口


进入控制台,选择自己已经开通的云服务器ECS产品,选择网络与安全,点击安全组,选择配置规则,然后选择手动添加,添加如上两个端口。

WEB界面访问HDFS和Yarn,直接在浏览器中输入外网IP地址:50070访问HDFS,外网IP地址:18088访问Yarn。




3 hadoop集群验证功能

HDFS功能测试
上传本地文件到HDFS根目录,命令如下:



1
2
3
hdfs dfs -put spark-3.0.1-bin-hadoop3.2.tgz hdfs://master:9000 /
#也可去掉hdfs://master:9000,core-site.xml中设置的hdfs名字。
hdfs dfs -put spark-3.0.1-bin-hadoop3.2.tgz  /





本地文件上传到HDFS成功的话,会在web端下 中看到上传的文件,以及文件备份数,文件块大小,文件块的存放位置。


Yarn功能测试
运行一个jar任务,计算pi(圆周率)大小,命令如下:



1
hadoop jar /usr/local/hadoop-3.2.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar pi 10 10




找到hadoop文件下的mapreduce例子运行,会在web端看到job历史。


不求点赞 只求有用


免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。

相关文章

新购阿里云服务器ECS创建之后无法ssh连接的问题处理

问题描述由于原服务器将要到期,因此趁着阿里云搞促销活动重新购买了一台ECS服务器,但是在初始化并启动后却无法通过ssh连接,执行ssh命令后,命令行一直卡着没有反应,也没有任何的报错信息,就是一直卡着...

阿里云服务器购买时面对众多地域,该如何选择

很多用户在购买阿里云服务器的时候,面对众多的地域,有些犯难不知道如何选择了,首先,咱们应该明白一点,阿里云的服务器所在机房在基础设施、BGP 网络品质、服务质量、云服务器操作使用与配置等方面,阿里云中...

阿里云服务器为什么那么不稳定经常崩溃掉线?

阿里云服务器为什么那么不稳定经常崩溃掉线?偶尔有站长抱怨阿里云服务器不稳定,经常死机掉,然后说阿里各种不是等。客观来说,阿里云在中国的市场份额还是很高的。建议大家买一台正规的阿里云服务器,购买成功后,...

阿里云服务器一个月多少钱?阿里云服务器租用优惠价格参考

阿里云服务器一个月多少钱?阿里云服务器是一种安全可靠、弹性可伸缩的云计算服务,提供有丰富的实例类型和多种存储可供选择,不同配置的云服务器租用费用会有所区别,具体可根据实际业务需要选择合适配置的产品。阿...

阿里云拼团优惠购活动:云服务器租用费用低至35元/年

阿里云拼团优惠购活动正在火热进行中,即日起至2022年1月23日邀请1个新用户好友一起拼团购买,云服务器租用费用低至35元/年,最高优惠761元!不限个人或企业用户。2021年阿里云年终特惠活动中,E...

阿里云服务器攻击超过云盾防御阀值应该怎么办?

阿里云服务器攻击超过云盾防御阀值应该怎么办?相信很多阿里云用户都曾收到过这样一条短信“受到攻击流量已超过云盾DDoS基础防护的带宽峰值,服务器的所有访问已被屏蔽”。赵一八笔记告诉大家在我们收到这样一条...