Hadoop：伪分布模式环境变量的配置-CDA数据分析师官网

Hadoop：伪分布模式环境变量的配置

2020-06-05

单节点集群模式（a Single Node Cluster）又称伪分布模式，只需一个节点即可运行。这种模式一般只是用来学习或者开发、测试使用。实际使用中还是使用多节点的分布式。

1、环境变量配置

为了方便的执行Hadoop程序，需要配置很多系统环境变量。主要有以下几个变量

设置HADOOP_HOME为Hadoop的安装路径

export HADOOP_HOME=/home/hduser/hadoop

设置将hadoop添加到PATH，上文中已经介绍过hadoop的运行文件在bin和sbin目录下，通过设置PATH后，我们可以在任何位置执行hadoop命令。

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin

设置hadoop其他环境变量

export HADOOP_MAPRED_HOME=$HADOOP_HOME

export HADOOP_COMMON_HOME=$HADOOP_HOME

export HADOOP_HDFS_HOME=$HADOOP_HOME

export YARN_HOME=$HADOOP_HOME

链接库的相关设置

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME

export HADOOP_OPTS=”-Djava.library.path=$HADOOP_HOME/lib”

export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH

与配置Jdk的系统环境变量方法一致，我们只需将需要配置的系统变量添加到用户主目录下的.bashrc文件中即可。打开Ubuntu虚拟机，然后打开Xshell连接登陆到虚拟机，在用户主目录下执行命令 vim .bashrc

在新的框体中输入i进入编辑模式，然后在文件末尾输入下述内容

按esc退出编辑模式，输入:wq保存并退出

命令行中输入 source .bashrc命令更新一下系统环境变量

更新完成后我们可以通过echo $HADOOP_HOME测试系统变量是否添加成功，如下图所示表明已经成功。

Hadoop 默认模式为非分布式模式（本地模式），无需进行其他配置即可运行。非分布式即单 Java 进程，方便进行调试。在此我们可以在本地模式下运行部分Hadoop自带MapReduce例子来验证Hadoop能够正常运行，同时体验Hadoop中MapReduce运行命令格式。在命令行中输入

cd hadoop/ #进入Hadoop安装文件目录

mkdir ./input #在hadoop文件夹下创建输入文件

cp ./etc/hadoop/*.xml ./input #将配置文件作为输入文件

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output 'dfs[a-z.]+' #运行MapReduce中grep例子，筛选符合正则表达式dfs[a-z]+的单词并统计其出现的次数，并将结果放入output文件夹中，关于正则表达式更多内容，参见附录三：正则表达式速查表格

cat ./output/* #查看运行结果

删除创建的文件使用以下命令

rm -r ./output

rm -r ./input

Hadoop 还可以在单节点上以伪分布式的方式运行，此时Hadoop 进程以分离的 Java 进程来运行，节点既作为NameNode 也作为 DataNode，同时读取的是 HDFS 中的文件。这种模式需要修改相应的配置文件，我们将会在下文中进行详细讲解。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想查询CDA考试成绩，点击>>> “CDA成绩” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想获取CDA考试时间/费用/条件/大纲/通过率，点击 >>>“CDA考试官网” 了解CDA考试详情；

Hadoop 正则表达式 HDFS 虚拟机 NameNode

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇Hadoop：集群网络介绍，及相关文件配置指南

下一篇拒绝目光短浅来造业，马斯克认为这些东西比钱更重要

Hadoop：伪分布模式环境变量的配置

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【干货】Pyecharts的帕累托分析技术实现，3步学会 ...

从DeepSeek聊梁文峰传奇经历汲取能量，踏上CDA备考 ...

【教程】30000字长文，手把手教你用Python实现统计 ...

【干货】2步学会构成分析，找到业务增长关键 ...

【干货】5分钟讲透数据分析之【对比分析】 ...

【干货】Deepseek教我数据可视化看板实时更新 ...

Deepseek如何帮助公司深入挖掘用户价值？ ...

【干货】指标波动归因分析：数据背后的故事 ...

【干货】2小时用AI完成的SQL教程也太赞了吧，不推荐 ...

【干货】你在纳闷用户为啥流失?华为已经用关系分析 ...

【干货】5分钟学会数据可视化：使用Pyecharts绘制地 ...

金三银四求职季，四份宝典助你脱颖而出！ ...

数据分析学习指南：从踩坑到精通的成长之路 ...

数据分析学习指南

一秒精通 Deepseek

Deepseek教我自学Python，貌似30天就够了 ...

【干货】2步学会构成分析，找到业务增长关键 ...

【2月】CDA网校2025 数据分析组队打卡学习活动第4期 ...

【干货】画用户画像与找相亲对象一样简单 ...

统计分析与数据挖掘的联系与区别