京公网安备 11010802034615号
经营许可证编号:京B2-20210330
hadoop是使用Java语言开发的并且Hadoop运行需要有Java环境的支持,因此在安装hadoop之前需要安装Java开发环境即JDK(Java Development Kit)。安装前首先向大家介绍以一下本文会用到的几个词:
JAVA_HOME:
一是为了方便引用,比如,JDK安装在/usr/lib/jvm/java-7-openjdk-i386目录里,则设置JAVA_HOME为该目录路径, 那么以后要使用这个路径的时候, 只需输入$JAVA_HOME即可, 避免每次引用都输入很长的路径串;
二则是归一原则, 当JDK路径改变的时候, 仅需更改JAVA_HOME的变量值即可, 否则,就要更改任何用绝对路径引用JDK目录的文档, 要是万一没有改全, 某个程序找不到JDK, 后果是可想而知的----系统崩溃!
三则是第三方软件会引用约定好的 JAVA_HOME 变量, 不然, 你不能正常使用该软件。
path 变量
path 变量使得我们能够在系统中的任何地方运行java等应用程序,比如 javac、java、javah 等等,这就要找到我们安装JDK 的目录,
假设我们的JDK安装在/usr/lib/jvm/java-7-openjdk-i386 目录下,那么在 /usr/lib/jvm/java-7-openjdk-i386/bin目录下就是我们常用的 java 应用程序,我们就需要把 这个目录加到 path 环境变量里面。
classpath 变量
classpath 环境变量,是当我们在开发java程序时需要引用别人写好的类时,要让 java 解释器知道到哪里去找这个类。通常,sun 为我们提供了一些额外的丰富的类包,一个是 dt.jar,一个是 tools.jar,这两个 jar 包都位于 /usr/lib/jvm/java-7-openjdk-i386\lib 目录下,所以通常我们都会把这两个 jar 包加到我们的 classpath 环境变量中。
JRE(Java Runtime Enviroment) 是 Java 的运行环境。面向 Java 程序的使用者,而不是开发者。如果你仅下载并安装了JRE,那么你的系统只能运行 Java 程序。JRE 是运行Java 程序所必须环境的集合,包含JVM标准实现及 Java核心类库。它包括 Java 虚拟机、Java 平台核心类和支持文件。它不包含开发工具(编译器、调试器等)。
JDK(Java Development Kit) 又称 J2SDK(Java2 Software Development Kit),是 Java 开发工具包,它提供了 Java 的开发环境(提供了编译器javac 等工具,用于将 java 文件编译为 class 文件)和运行环境(提 供了 JVM 和 Runtime 辅助包,用于解析 class 文件使其得到运行)。如果你下载并安装了 JDK,那么你不仅可以开发 Java 程序,也同时拥有了运行 Java 程序的平台。JDK 是整个 Java 的核心,包括了Java运行环境(JRE),一堆 Java 工具 tools.jar 和 Java 标准类库 (rt.jar)。
1、JDK安装方式及版本介绍
JDK在Ubuntu下的常用安装方式有两种:一种是使用apt-get等类似软件包管理工具在线安装,另一种方式为离线安装:将编译好的软件代码先下载然后安装。JDK的版本有许多,常用的是jdk1.7、jdk1.8,为了简化安装过程我们本次采用apt-get在线方式安装jdk1.7版本。
2、安装
首先启动ubuntu系统的终端,然后在终端中输入java -version来查看系统是否已安装jdk。结果如下图所示,未安装jdk。
在Linux中既可以使用apt进行软件包管理,也可以使用apt-get下载安装软件包。
为了获得最新软件包版本,我们使用apt-get安装jdk之前需先执行apt-get update来更新软件源信息。
执行apt-get 命令需要较高的权限,因此命令前需加sudo命令
sudo apt-get update
经过一段时间的更新与下载之后,软件源信息更新完成。
下面开始安装JDK,安装jdk的命令为:sudo apt-get install default-jdk。
软件下载、安装需要一定的空间,安装程序会提示是否继续执行,输入Y然后按回车键即可。
软件下载及安装需要一定时间,耐心等待即可无需其他操作。执行到下图出现done表示已经完成安装。
此时可以通过执行java -version命令查看JDK安装版本。
3、系统环境变量配置
有些软件运行需要用到系统变量JAVA_HOME CLASS_PATH因此我们还需要讲安装好的JDK进行配置。首先可以通过命令sudo find / -name javac来查找jdk的安装位置。如下图所示jdk的安装位置为:/usr/lib/jvm/java-7-openjdk-i386
我们可以通过ls命令查看jdk下面都有哪些文件,如下图所示jdk下面有bin、jre、lib等文件目录,其中bin目录下有java常用开发编译工具如javac等,而jre/bin下有java程序的运行环境如java程序等。lib目录在文章开始的时候也提到了,里面有java开发常用的类库。
我们执行cd命令可以直接回到用户主目录下
接下来我们配置一下环境变量,在用户主目录下执行 vim ./bashrc,在该文件中输入下图信息并保存。
刷新一下系统配置文件,使用命令source ./bashrc
我们可以通过命令:echo 变量名 方式查看配置的环境变量是否成功。
如上图所示,显示的信息与我们实际配置是一致的,jdk安装完成。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12