推荐阅读文章列表
前言
很多同学面试被问到 项目中的集群环境是如何搭建的?
你是不是还在这样回答:我通过三台虚拟机搭建的大数据集群环境,资源配置是 2核CPU、3G内存、20G磁盘
这样在企业级大数据场景下,是不可行的,大公司一般会有自己的物理服务器,中小公司一般会租用云服务厂商提供的云服务,在真实的服务器上来部署相应的大数据集群
如果你即将开始大数据学习,建议通过云服务器的方式来搭建大数据集群
如果你在面试大数据岗位,建议将项目部署在虚拟机上 说成 将项目部署在云服务器上
傻瓜式安装教程
以阿里云为例
第一步:进入阿里云官网首页 - 产品 - 云服务器ECS
第二步:点击立即购买,进入配置选项页面,最后点击立即下单即可(其中CPU和内存可根据实际情况选择)
第三步:实例创建成功后,进入控制台管理页面,显示三台正在运行中的实例,就表示服务器环境创建成功了
第四步:下载一个远程连接工具(如xshell、termcc等),通过公网IP连接相应的三台服务器
第五步:开启大数据集群的安装之旅,包括Hadoop、Hive、Kafka、HBase、Spark、Flink、Doris、Paimon等框架,后期会继续更新详细教程
写在最后
V7.0笔记获取方式
公众号回复:大数据面试笔记

