搬瓦工Ubuntu 20.04上安装Apache Spark教程

admin3年前主机评测131

apache spark前几年在学术界是非常火的,最近几年可能不是那么火了,因为能研究的问题似乎都已经被研究的差不多了,最近都开始研究新的分布式框架了。本文就介绍一下如何在ubuntu20.04 Linux 操作系统上安装 Apache Spark 教程,包括安装 Java、安装 Apache Spark、以及通过 Apache Spark Web 界面访问的教程。Apache Spark 是一个用于大规模数据处理的开源、通用、多语言分析引擎。通过利用集群中的 RAM 对大量数据执行快速数据查询,它可以在单个和多个节点上工作。它提供批处理数据处理和实时流式传输,并支持 Python、SQL、Scala、Java 或 R 等语言的高级 API。该框架提供内存技术,使其能够将查询和数据直接存储在集群节点的主存储器。

安装 Java

更新系统包:

$ sudo apt update

安装 Java:

$ sudo apt install default-jdk -y

确认 Java 安装:

$ java -version

安装必要的包:

$ sudo apt install curl mlocate git scala -y

下载 Apache Spark,最新版可以在这里下载:spark.apache.org/downloads.html

$ curl -O archive.apache.org/dist/spark/spark-3.2.0/spark-3.2.0-bin-hadoop3.2.tgz

解压 Spark 安装包:

$ sudo tar xvf spark-3.2.0-bin-hadoop3.2.tgz

创建安装目录:

$ sudo mkdir /opt/spark

移动文件到安装目录:

$ sudo mv spark-3.2.0-bin-hadoop3.2/* /opt/spark

修改目录权限:

$ sudo chmod -R 777 /opt/spark

编辑 bashrc 配置文件,将 Apache Spark 安装目录添加到系统路径:

$ sudo nano ~/.bashrc

将下面两行代码添加到文件最后:

export SPARK_HOME=/opt/spark

export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

保存文件并使之生效:

$ source ~/.bashrc

启动独立主服务器:

$ start-master.sh

通过访问 http://ServerIPaddress:8080 从仪表板中查找您的服务器主机名。它可能看起来像这样:

URL: spark://my-server-development:7077

启动 Apache Spark 工作进程。使用您的服务器主机名更改 spark://ubuntu:7077。

$ start-slave.sh spark://ubuntu:7077

转到浏览器地址栏以访问 Web 界面并输入 http://ServerIPaddress:8080 以访问 Web 安装向导。例如:

http://192.0.2.10:8080

至此,您已在服务器上安装了 Apache Spark。您现在可以访问主仪表板,开始管理您的集群。

搬瓦工VPS套餐

搬瓦工美国CN2 GIA/日本软银

最高10Gbps带宽,可选:美国cn2 gia、日本软银,企业级高端网络带宽。VPS基于KVM虚拟,SSD raid10阵列,自带一个IPv4,免费支持snapshot快照功能(可以导入、导出)和Backup(备份功能),可以一键更换IP、一键切换机房。

内存

CPU

SSD

流量

带宽

价格

购买

1G2核20G1.0T/月2.5G$50/季

链接

2G3核40G2.0T/月2.5G$90/季

链接

4G4核80G3.0T/月2.5G$57/月

链接

8G6核160G5.0T/月5.0G$87/月

链接

16G8核320G8.0T/月10G$160/月

链接

32G10核640G10.0T/月10G$290/月

链接

64G12核1280G12.0T/月10G$550/月

链接

免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。

相关文章

海外虚拟主机租用对网站优化有影响吗?

海外虚拟主机免备案、性价比高、访问速度快、稳定性好,因为现在很多站长都喜欢租用海外虚拟主机来建设网站。纵使海外虚拟主机有诸多优势,但仍然有很多站长都会顾虑,例如,使用海外虚拟主机对网站SEO优化是否有...

阿里云、腾讯云服务器对比,哪个更好用?

阿里云、腾讯云服务器对比,哪个更好用?阿里云、腾讯云是国内排行前二的云计算平台,在云计算相关技术实力、应用实践上都位于国内领先地位,所以单就云服务器层面,两家的技术实力相差不大。目前,国内云服务器的竞...

亚云(asiayun):元旦活动,大陆ECS六折,成都高防vps七折,成都大配置铂金区立减100,香港CN2 GIA七折,美国CERA二区七折

亚云asiayun怎么样?亚云由亚云团队运营,拥有ICP/ISP/IDC/CDN等资质,亚云团队成立于2018年,经过多次品牌升级。主要销售主VPS服务器,提供云服务器和物理服务器,机房有成都、美国C...

美国服务器网被DDos有哪些防御策略

美国服务器网被DDos有哪些防御策略网络攻击已经成为当前互联网发展的一种常见形式其中DDoS攻击是一种针对服务器网站的高强度攻击方式。如果美国服务器网面临DDoS攻击网站管理员应该采用哪些防御策略呢1...

短视频服务器多少钱

短视频服务器多少钱在当前的短视频趋势下越来越多人选择自己搭建短视频平台那么短视频服务器是非常重要的一环。但是很多用户不知道短视频服务器的价格是多少今天我们就来为您解答一下。短视频服务器的价格短视频服务...

HostYun:洛杉矶/日本/韩国/香港VPS月付15元起,KVM架构,CN2 GIA等多线路

hostyun怎么样?hostyun是 一家成立于2008年的国人VPS主机商,其前身为hostshare(主机分享组织),由Hostloc论坛的多名资深会员创立并负责技术和运营,已稳定运营超过12年...