tnblog
首页
视频
资源
登录

hadoop完全分布式

5068人阅读 2022/4/20 13:15 总访问:89566 评论:0 收藏:0 手机
分类: hadoop

系统说明

    系统:CentOS 7(最小化安装)

    节点信息:

节点ip
emo1192.168.2.7
emo2192.168.2.8
emo3192.168.2.9

搭建步骤详述(默认情况下emo1主机为主节点)

一、节点基础配置

1、配置各节点网络

设置节点的IP地址

vi /etc/sysconfig/network-scripts/ifcfg-ens33
    BOOTPROTO="static"
    IPADDR=192.168.2.7
    NETMASK=255.255.255.0

修改各节点的名字
vi /etc/hostname
   emo1

添加映射

vi /etc/hosts

  1. 127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
  2. ::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
  3. 192.168.2.10 master
  4. 192.168.2.20 slave1
  5. 192.168.2.30 slave2
  6. scp /etc/hosts emo2:/etc/[复制的前提是需要设置免密登录]

关闭防火墙
vi /etc/selinux/config

   SELINUX=disabled

systemctl stop firewalld
systemctl disable firewalld
systemctl status firewalld




免密登录
ssh-keygen -t rsa
ssh-copy-id emo1
ssh-copy-id emo2
ssh-copy-id emo3
(登陆:ssh emo1       退出:logout)



2.安装Java和hadoop

tar -zxvf jdk-8u191-linux-x64.tar.gz
tar -zxvf hadoop-2.7.7tar.gz

vi /etc/profile
export JAVA_HOME=/usr/local/src/java/jdk1.8.0_191
export JAVA_HOME=/usr/local/src/hadoop/hadoop-2.7.7
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

source /etc/proffile

java -version
hadoop


3.修改hadoop配置文件
cd /usr/local/src/hadoop/hadoop-2.7.7/etc/hadoop

export JAVA_HOME=/usr/local/src/java/jdk1.8.0_191

vi  core-site.xml (需要在hadoop-2.7.7创建tmp目录)

<property>
<name>fs.defaultFS</name>
<value>hdfs://emo1:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/src/hadoop/hadoop-2.7.7/tmp</value>
</property>

vi hdfs-site.xml
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/src/hadoop/hadoop-2.7.7/hdfs/data</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/src/hadoop/hadoop-2.7.7/hdfs/name</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>

vi yarn-site.xml
<property>
<name>yarn.resourcemanager.address</name>
<value>emo1:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>emo1:8030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>emo1:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>emo1:8033</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:8088</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>emo1:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>emo1:19888</value>
</property>



vi masters
emo1

vi slaves
emo2
emo3

将环境变量文件、jdk和hadoop安装目录文件同步至子节点
同步环境变量文件
scp /root/.bash_profile slave1:/root/
scp /root/.bash_profile slave2:/root/
同步jdk安装文件
scp -r ../java slave1:/usr/local/src/
scp -r ../java slave2:/usr/local/src/
同步hadoop文件
scp -r ../hadoop slave1:/usr/local/src/
scp -r ../hadoop slave2:/usr/local/src/
子节点刷新环境变量
slave1机器:
source /root/.bash_profile
slave2机器:
source /root/.bash_profile
````

格式化命令

hadoop namenode -format

启动命令

start-all.sh

关闭集群
stop-all.sh


























































评价

尘叶心繁

2025/1/10 15:50:49

[good]

Windows平台分布式架构实践 - 负载均衡

原文地址: https://www.cnblogs.com/atree/p/windows_loadbalancer.html 概述  最近.NET的世界开始闹腾了,微软官方终...

分布式服务架构与微服务架构概念的区别与联系

分布式:分散压力。微服务:分散能力。当下理解分布式:不同模块部署在不同服务器上作用:分布式解决网站高并发带来问题集...

分布式-微服务-集群的区别

1.分布式将一个大的系统划分为多个业务模块,业务模块分别部署到不同的机器上,各个业务模块之间通过接口进行数据交互。区...

c webservice二:基本分布式访问

使用webservice接口有个好处就是可以分布式访问。例如我们在玩游戏的时候先要选择一个区,然后在进入游戏。这样是因为如果...

net core实现分布式session单点登录

要想在net core中实现分布式session,实现单点登录,我们可以把session保存到redis中,这样就可以多个项目共享session,因为...

微服务、分布式架构项目的一点点想法

分布式与微服务的区别:说一点个人理解分布式: 分散压力。 不同功能块之间的通讯少,还是会有不少代码,每一...

.netCore 使用分布式缓存(docker+redis)

1. 通过docker创建 Redis执行命令:dockerrun--nameasp-redis-p6379:6379-dredis查看redis状态:dockerps可以发现alreadywo...

Redis分布式

public static RedisClient Redis;static CommonService(){ Redis = new RedisClient();}public static dynamic RedisLock...

.net core 集成事件分布式事务解决方案

.net core 集成事件,分布式事务解决方案[TOC] 简单介绍 CAP是基于.Net标准的库,该库是处理分布式事务的解决方案,具有...

.net core分布式缓存微软官方文档

https://docs.microsoft.com/zh-cn/aspnet/core/performance/caching/distributed?view=aspnetcore-5.0#distributed-redis...

ElasticSearch 分布式搜索引擎

前言:大家好,我是小付 今天和大家谈谈分布式搜索引擎这个东东,这个玩意现在有很多大企业都在用,所以就度了一下 了解了...

Dapr 官方教程第三章(分布式计算器)

Dapr 官方教程第三章(分布式计算器)[TOC] 本快速入门通过分布式计算器展示了 Dapr 的方法调用和状态持久性功能,其中每个...

分布式日志收集框架Seq重置密码

windows下seq service stop seq auth --basic -u &lt;username&gt; -p &lt;new password&gt; seq service start docker...

Dapr 分布式

Dapr 分布式锁[TOC] 分布式锁简介简单来讲:两个人做一件事情,同一时间内,我做的时候你不可以做,除非我没有在规定的时...

分布式定时任务的概念。分布式概念

分布式定时任务就是把分散的、批量的后台定时任务纳入统一的管理调度平台,实现任务的集群管理、调度和分布式部署管理方式。...
1
排名
158
文章
3
粉丝
0
评论
1
ICP备案 :渝ICP备18016597号-1
网站信息:2018-2025TNBLOG.NET
技术交流:群号656732739
联系我们:contact@tnblog.net
公网安备:50010702506256
欢迎加群交流技术