Hadoop入门-单机伪分布式配置-白红宇

Hadoop入门-单机伪分布式配置

阅读量：7006 次

发布时间：2019-06-27

本文共 3646 字，大约阅读时间需要 12 分钟。

为了配置的的方便建议先提升你的登录用户权限，本配置中凡是要在终端中输入的命令都用红色字体，需注意对应的目录用了色字体标出。

启用超级用户sudo passwd root（然后输入你的超级用户密码）以后在终端中输入su，再输入该密码就可以用超级用户登录了

提升用户权限命令，在终端中输入sudo gedit /etc/passwd

在文件末尾找到你的登录用户：我的是szllong:x:1000:1000:szllong,,,:/home/szllong:/bin/bash将其中的两个1000改为0保存并退出，重启电脑输入你的用户名和密码（我的用户名就是szllong，这里可能会习惯性的直接输入密码需注意）。

由于root登录有助多不变，建议配置完成后，再将你的权限改回来。

接下来就可以正式安装了。

1、安装基础工具

ssh

ubuntu默认并没有安装ssh服务，如果通过ssh链接ubuntu，需要自己手动安装ssh-server。判断是否安装ssh服务，可以通过如下命令进行：ssh localhost

如上没出现 ssh: connect to host localhost port 22: Connection refused，表示没有还没有安装，可以通过apt安装，共三个，命令如下：

apt-get install ssh

apt-get install openssh-server

sudo apt-get install rsync

很多介绍里会在前面加入sudo，这是为了要获得root权限，这是可能还要输入你的用户密码，下同

2、安装JDK

下载源码包jdk-7u4-linux-i586.tar.gz

(jdk版本可以根据需要自己下载最新版本，但在接下来环境配置时记得要改为相应版本)

将之放到目录：/usr/lib/jvm下

（这里位置目录可以自己定义，JDK环境变量需要对应）

进入该目录直接解压：tar zxvf jdk-7u4-linux-x64.tar.gz

3、安装hadoop-1.0.3.tar.gz，到hadoop官网下载hadoop-1.0.3.tar.gz

（此时hadoop-1.0.3.tar.gz是最稳定的版本，可以根据情况选择其他版本）

3.1、将下载包解压到usr目录tar zxvf hadoop-1.0.3.tar.gz

3.2、修改hadoop-env.sh配置

这里有两种配置方法一种是直接通过vi配置，这需要对它有一定的了解，由于我是个新手所以就直接找到该文件，然后对之进行修改（这时用具有root权限的用户登录就有优势了，因为这些配置文件的权限属于root，普通用户是不具有该权限的）

先给出通过vi配置的方法，这是我在网上百度的，没有实验过，但这里的目录名需要与你的先前解压目录相对应（即/usr/lib/jvm/jdk1.7.0_04目录）

vi conf/hadoop-env.sh

# 找到JAVA_HOME设置：export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

# 在文件末尾加以下内容, 取消环境变量$HADOOP_HOME过时的警告:export HADOOP_HOME_WARN_SUPPRESS=1

配置环境变量(集群节点都要配置环境变量)

vi /etc/profile

在文件中末尾加入以下内容：

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

export PATH=$JAVA_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export HADOOP_HOME=/hadoop-1.0.3

export PATH=$PATH:$HADOOP_HOME/bin

让环境变量生效

source /etc/profile

Java代码 §

配置

使用如下的 conf/core-site.xml:

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

Java代码 §

配置

使用如下的 conf/hdfs-site.xml:

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

Java代码 §

配置

使用如下的 conf/mapred-site.xml:

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

接下来给出直接配置方法，直接配置方法就是直接在你的安装目录中修改该文件，

1.在usr/hadoop1.0.3/conf目录下找到hadoop-env.sh文件后打开，注意因为现在是root用户登录，所以可能会出现一个对话框，这里要选显示而不是执行

找到

# export JAVA_HOME=/usr/lib/j2sdk1.5-sun

（# 表示注释，它之后的句子不被执行，仅起提示作用）

再该句话下加入配置环境语句（注意目录的对应）

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

在文件末尾加

export HADOOP_HOME_WARN_SUPPRESS=1

取消环境变量$HADOOP_HOME过时的警告:

2.配置环境变量

在etc目录下找到profile文件，在其末尾加入以下内容（这里同样要注意目录的对应）

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_04

export PATH=$JAVA_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export HADOOP_HOME=/hadoop-1.0.3

export PATH=$PATH:$HADOOP_HOME/bin

由于#可以起到注释作用，你可以在这里加上

#I add something to make java-jdk active times:2012 08 24 22:36

唯一标识

让环境变量生效

在终端中source /etc/profile

3.配置三个文件

在usr/hadoop1.0.3/conf中找到core-site.xml文件

在<configuration>

</configuration>

中加入

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

找到hdfs-site.xml文件

在<configuration>

</configuration>

中加入

<name>dfs.replication</name>

</property>

找到mapred-site.xml文件

在<configuration>

</configuration>

中加入

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

4.在终端中输入ssh localhost如果需要输入密码则输入密码后运行以下两条命令，

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

这是为了，配置自由登录hadoop的密码，第一句是产生，第二句是分发

5.用cd命令进入usr/hadoop1.0.3中输入bin/hadoop namenode -format进行格式化

6. 输入bin/start-all.sh启动hadoop

7.在浏览器中输入，如显示的有磁盘容量表示已经配置成功。

注意因定要进入hadoop安装目录后再运行bin...命令，否则会出现找不到文件或文件夹

转载于:https://my.oschina.net/u/588340/blog/74541

你可能感兴趣的文章

【转】android gravity属性和 weight属性

vuejs组件交互 - 03 - vuex状态管理实现组件交互

查看>>

SQL Server 2017 安装过程中的一点说明（有点意思）

查看>>

Qt编写的RTSP播放器+视频监控(vlc版本)

查看>>

一起谈.NET技术，关于Expression Tree和IL Emit的所谓的"性能差别"

查看>>

CGI, mod_perl, PHP, JSP性能比较

查看>>

密码库链接

查看>>

JS组件系列——BootstrapTable+KnockoutJS实现增删改查解决方案（四）：自定义T4模板快速生成页面...

可爱的python测试开发库(python测试开发工具库汇总)

查看>>

python返回汉字的首字母

查看>>

linux下yum更新出现HTTP Error 404 NOT FOUND错误的办法

查看>>

Nginx负载均衡配置实例

查看>>

Percona-mysql-5.5.38双主复制&mmm配置

查看>>

spring高级之拦截器

查看>>

Python（四）装饰器、迭代器&生成器、re正则表达式、字符串格式化

查看>>