Cloudera大数据平台环境搭建(CDH5.13.1)傻瓜式说明书

合集下载

cdh安装hadoop教程

cdh安装hadoop教程

cdh安装hadoop教程CDH(Cloudera's Distribution including Apache Hadoop)是一种基于Apache Hadoop的大数据处理平台,它提供了一套完整的Hadoop生态系统工具和组件。

CDH安装教程一共包含以下几个步骤:1. 系统准备:在开始安装之前,我们需要确保系统满足CDH的最低要求。

CDH要求操作系统为RHEL / CentOS 6或7,并且至少有8GB的内存,2个vCPU,100GB的磁盘空间和64位操作系统。

此外,还需要配置主机名、网络和防火墙设置。

2. JDK安装:CDH依赖于Java运行环境。

首先需要在系统上安装JDK。

可以从Oracle官方网站或OpenJDK获取JDK安装包。

安装JDK后,还需要设置JAVA_HOME环境变量。

3. CDH下载:在安装CDH之前,我们需要从Cloudera官网下载CDH安装包。

Cloudera提供了几个版本,包括CDH4、CDH5和CDH6。

根据需要选择合适的版本下载。

4. 安装CDH:解压CDH安装包,并根据官方文档进行安装。

安装过程中需要指定一个安装目录和一个临时目录,还需要配置Hadoop配置文件如core-site.xml、hdfs-site.xml、yarn-site.xml等。

这些配置文件用于定义Hadoop集群的相关属性,如数据节点、名称节点、资源管理器等。

5. 启动Hadoop集群:完成CDH安装后,我们需要启动Hadoop集群。

首先启动HDFS服务,然后启动YARN服务。

可以使用启动脚本启动Hadoop集群,或者使用Cloudera Manager进行管理。

6. 验证集群状态:一旦Hadoop集群成功启动,我们需要验证集群的状态。

可以通过命令行工具hdfs dfs -ls /或yarn node -list来检查HDFS和YARN的状态。

如果一切正常,应该能够看到节点列表和文件系统的目录。

cdh运维手册

cdh运维手册

cdh运维手册CDH运维手册是一份详细介绍CDH(Cloudera Distribution of Hadoop)运维过程的指南。

本文旨在帮助运维人员更好地掌握CDH的部署、管理、维护及优化方法,以确保集群稳定高效运行。

I.引言CDH是基于Apache Hadoop的分布式大数据处理平台,包括Hadoop、Spark、Hive、Pig等组件。

在实际应用中,CDH面临着复杂的运维挑战。

为了提高运维效率,降低故障风险,我们需要深入了解CDH的运维流程。

II.CDH简介CDH(Cloudera Distribution of Hadoop)是Cloudera公司推出的一款大数据处理平台。

它包含了Hadoop的核心组件,如HDFS、YARN、MapReduce等,以及一系列数据处理工具,如Spark、Hive、Pig等。

CDH 提供了一整套大数据解决方案,满足企业在数据存储、分析、挖掘等方面的需求。

III.CDH运维流程A.环境搭建:根据业务需求,选择合适的硬件资源、网络环境和操作系统。

搭建CDH集群,包括配置核心组件和相关工具。

B.数据迁移:将原始数据迁移至CDH集群,根据数据特点选择合适的存储格式和压缩算法。

C.运维管理:监控CDH集群的运行状态,包括资源使用情况、任务进度、日志等。

定期进行性能评估,优化集群配置。

D.故障排查:遇到问题时,快速定位故障原因,采取相应措施进行解决。

E.性能优化:针对CDH集群的性能瓶颈,采取调整参数、优化任务流程等措施,提高集群性能。

F.安全防护:确保CDH集群的安全性,防范外部攻击和内部安全风险。

IV.运维工具与技巧A.常用工具:掌握CDH运维过程中所需的常用工具,如Hadoop DistCp、Hive Query、Spark Submission等。

B.自动化脚本:编写自动化脚本,实现批量任务调度、日志收集、性能监控等功能。

C.监控与报警:搭建CDH集群监控系统,实现实时报警,确保问题及时发现并处理。

ClouderaManager5系列升级文档

ClouderaManager5系列升级文档

ClouderaManager及CDH升级说明书升级内容1、升级Cloudera Manager Server到5.12.1版本2、升级Cloudera Manager Server DB 到5.12.1版本3、升级Cloudera Manager agent 到5.12.1版本4、升级CDH到5.12.1版本5、升级JDK到1.8版本6、按照Spark2.2升级步骤1、收集升级信息a)主机认证信息:集群使用hdroot用户安装。

b)当前CM版本号:Cloudera Express 5.4.8 (#7 built by jenkins on 20151023-1203git: d7dbdf29ac1d57ae9fb19958502d50dcf4e4fffd)c)当前CDH版本号:CDH 5.4.8, Parceld)Cloudera Manager用户名和密码e)集群启用的服务:i.Flumeii.Hbaseiii.HDFSiv.Hivev.Impalavi.Kafkavii.Sqoop2viii.YARNix.ZookKeeperx.Cloudera Management Servicef)集群使用Parcel安装,版本为CDH 5.4.8g)JDK版本:openjdk1.7h)操作系统版本:CentOS6.72、数据库备份a)Cloudera Manager数据库备份i.查看数据库连接信息:cat /etc/cloudera-scm-server/db.propertiesii.备份语句:pg_dump -h localhost -p 7432 -U scm >/home/clusterUpdate/scm_server_db_backup.$(date +%Y%m%d)b)元数据库备份i.Hive:mysqldump -uroot hive > /home/clusterUpdate/hive.sqlii.amon:mysqldump -uroot amon > /home/clusterUpdate/amon.sqliii.rman:mysqldump -uroot rman > /home/clusterUpdate/rman.sql3、升级Cloudera Managera)首先停止集群上的所有服务b)停止Cloudera Manager server:service cloudera-scm-server stopc)停止Cloudera Manager server DB:service cloudera-scm-server-db stopd)停止Cloudera Manager client:service cloudera-scm-agent stope)修改yum信息(所有服务器):i.vi cloudera-manager.repo[cloudera-manager]name = Cloudera Manager, Version 5.12.1baseurl = /cm5/redhat/6/x86_64/cm/5.12.1/gpgkey = /cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera gpgcheck = 1f)清理yum缓存:yum clean allg)建立yum索引:yum makecache allh)升级Cloudera Manager服务:yum upgrade cloudera-manager-*4、升级JDK(所有服务器)cd /home/clusterUpdate/tar -zxvf jdk-8u144-linux-x64.tar.gzmkdir -p /usr/local/javacp -R jdk1.8.0_144/ /usr/local/java/yum -y remove java*echo JAVA_HOME=/usr/local/java/jdk1.8.0_144 >> /etc/profileecho JRE_HOME=/usr/local/java/jdk1.8.0_144/jre >> /etc/profileecho SCALA_HOME=/opt/scala-2.11.4 >> /etc/profileecho SPARK_HOME=/opt/cloudera/parcels/SPARK2-2.2.0.cloudera1-1.cdh5.12.0.p0.142354/lib/spark2 >> /etc/profileechoCLASSPATH=.:\$JAVA_HOME/lib/dt.jar:\$JAVA_HOME/lib/tools.jar:\$JRE_HOME/lib >>/etc/ profileecho PATH=\$SCALA_HOME/bin:\$JAVA_HOME/bin:\$PATH >>/etc/profileecho export PATH JAVA_HOME CLASSPATH SCALA_HOMESPARK_HOME >>/etc/profilesource /etc/profileecho $JAVA_HOMEecho $CLASSPATHecho $PATHecho $SCALA_HOMEecho $SPARK_HOMEjava -version5、启动Cloudera Manager服务a)启动Cloudera Manager server DB:service cloudera-scm-server-db restartb)启动Cloudera Manager server:service cloudera-scm-server restartc)启动Cloudera Manager client:service cloudera-scm-agent restart6、升级客户端a)Web访问地址:http://<cloudera-server-IP>:7180/cmf/loginb)c)/cm5/redhat/6/x86_64/cm/5.12.1//cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-clouderad) e)f) g)h) i)j)k)l)修改内嵌数据库提示:i.搜索Enable Embedded Database Checkm)修改JDK_HOME:i.搜索Java:/usr/local/java/jdk1.8.0_1447、升级CDH到5.12.1a)备份NameNode数据(cloudera01服务器和cloudera02服务器)cd /mnt/app/dfs/nn1tar -cvf /home/clusterUpdate/nn1_backup_data.tar .cd /mnt/app/dfs/nn2tar -cvf /home/clusterUpdate/nn2_backup_data.tar .b)升级CDHc)d) e)。

Cloudera大数据平台环境搭建

Cloudera大数据平台环境搭建
00 * * * /usr/sbin/ntpdate 192.168.137.101
3 reboot
第16页
Cloudera大数据平台环境搭建-系统环境
系统参数 已启用透明大页面压缩,可能会导致重大性能问题。请运行: echo 10 > /proc/sys/vm/swappiness echo 'vm.swappiness=10'>> /etc/sysctl.conf echo 'echo never > /sys/kernel/mm/transparent_hugepage/defrag' >> /etc/rc.local echo 'echo never > /sys/kernel/mm/transparent_hugepage/enabled' >> /etc/rc.local
简单来说:CDH 是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件
),使得集群的安装可以从几天的时间缩短为几个小时,运维人数也会从数十人降低到几个人,极大的
提高了集群管理的效率。
CDH体系架构
批处理 (M/R,Hive,Pig)
数据分析 (Impala)
搜索引擎
流处理
机器学习(Spark、
第18页
Cloudera大数据平台环境搭建-数据库环境
本节主要统一介绍与数据库相关组件的安装,便于统一规划,因为这些组件在安装、应用过程中都有 关联,这节配置基本与后续的数据库配置页面相关,随后再提,现在有个准备,保留。
数据库环境
1、 JDK
2、Mysql
3、JDBC
4、创建数据库
第19页

cloudera-quickstart安装使用总结

cloudera-quickstart安装使用总结

一、cloudera-quickstart的安装(1)在官网上下载一种版本的cloudera-quickstart(有三种不同版本分别对应的可以在三种不同的虚拟机上运行)(2)根据下载的不同版本下载虚拟机(VMware or VisualBox)(3)以VisualBox虚拟机为例则可以运行cloudera-quickstar的基本配置如下:RAM内存至少为8G虚拟处理器分配为两个(4)虚拟机配置好以后,不用先安装Linux操作系统。

因为cloudera-qiuckstart对包括操作系统在内的都已经打好包了,所以只需将下载的cloudera-quickstart的虚拟磁盘(比如:cloudera-quickstart-vm-5.1.0-1-virtualbox-disk1.vmdk)添加到虚拟机控制器的位置然后启动虚拟机中的该的系统,cloudera-quickstart所包含的一整套系统就可以使用了,这就是quickstart 版本的方便之处。

具体操作如下:进入配置好的虚拟机页面,选择“存储”,然后点下图红圈标注的位置会弹出来如下对话框,选择“使用现有的虚拟盘”然后再找到你下载的cloudera-quickstart的虚拟磁盘所在的位置,点击“打开”则虚拟磁盘就被添加进去了,如下图所示最后启动该系统对于win7系统上如果安装VMware虚拟机有可能在启动虚拟磁盘时会提示出现内部错误(如下图所示),此时只需要以管理员身份运行虚拟机就可以解决该问题了。

二、cloudera manager控制页面启动虚拟机进入cloudera-quickstart操作系统桌面后,会自动跳出浏览器上cloudera的控制平台。

但有可能会出现接口连接不上服务器的状况,如下图所示:此时有两种解决方法:(1)点击桌面上的“Launch cloudera manager”(2)打开Linux的控制终端输入:“sudo/home/cloudera/cloudera-manager--force”一般我比较喜欢采取第二种方法。

CDH5离线安装手册

CDH5离线安装手册

Cloudera manage(离线)安装手册
1. 准备工作
1.1. 系统环境
硬件设备:16G内存,1.8T
网络组成:
172.16.41.41 j1
172.16.41.42 j2
172.16.41.43 j3
操作系统:Centos6.4 64位
1.2. 安装JDK
从官方网站上下载rpm包,本次使用版本1.7.0_79(CDH5可能支持1.7之前的版本,具体情况未经测试),执行命令:
rpm -ivhjdk-7u60-linux-x64.rpm
由于是rpm包并不需要我们来配置环境变量,我们只需要配置一个全局的JAVA_HOME变量即可,执行命令:
echo &quot;JAVA_HOME=/usr/java/latest/&quot; &gt;&gt;/etc/environment
执行命令,查看Jdk是否安装正确
java -version
javac -version
1.3. 修改主机名
修改/etc/sysconfig/network文件: NETWORKING=yes
HOSTNAME=j1
其中HOSTNAME与主机名一致。

主机名如果跟系统安装时不一致请执行hostname命令让其立即生效,否则会影响各节点互相访问,命令如下:
hostname master
修改/etc/hosts文件,添加: 172.16.41.41 j1
172.16.41.42 j2
172.16.41.43 j3。

大数据平台用户手册

大数据平台用户手册

大数据平台用户手册修订记录目录1.前言 (1)1.1.系统介绍 (1)1.2.目标用户 (1)2.运行环境 (1)2.1.现有服务器及配置 (1)2.2.生产环境部署 (2)2.3.生产环境服务器及配置 (2)2.4.私有环境部署 (3)2.5.私有环境服务器及配置 (3)3.系统功能 (4)3.1.平台管理中心 (4)3.1.1.平台总览 (4)3.1.2.资源管理 (4)3.1.3.数据连接管理 (8)3.2.数据开发中心 (9)3.2.1.项目列表 (9)3.2.2.离线同步中心 (12)3.2.3.离线开发中心 (15)3.2.4.实时同步中心 (19)3.2.5.实时开发中心 (21)3.3.运维监控中心 (24)3.3.1.概述 (24)3.3.2.离线运维中心 (24)3.3.3.实时运维中心 (27)3.4.数据资产中心 (29)3.4.1.概述 (29)3.4.2.数据资产概览 (29)3.4.3.元数据管理 (30)3.4.4.元数据检索 (32)3.5.数据服务中心 (34)3.5.1.概述 (34)3.5.2.数据服务开发 (34)3.5.3.数据服务管理 (36)3.5.4.应用管理 (38)3.6.算法平台中心 (40)3.6.1.概述 (40)3.6.2.功能操作 (40)4.注意事项 (41)1.前言1.1.系统介绍大数据平台是自主研发的企业级大数据中台产品,旨在帮助用户快速收集数据、快速整理数据、快速构建数仓、数据服务管理以及数据资产管理。

通过平台可构建PB级别数据仓库及进行数据价值的深度挖掘,实现超⼤规模数据的资产化。

自主研发的全链条、一体化、轻量级、开放式的通用大数据平台,平台通过对海量历史与实时数据的采集、计算、存储、分析、挖掘、推荐,极大提升数据开发和应用的效率。

1.2.目标用户项目管理员,项目开发人员,项目运维人员,安全管理员,业务人员。

2.运行环境2.1.现有服务器及配置2.2.生产环境部署2.3.生产环境服务器及配置2.4.私有环境部署2.5.私有环境服务器及配置3.系统功能3.1.平台管理中心3.1.1.平台总览3.1.1.1.功能描述➢总体展示平台的总体功能模块,点击选择功能模块快速进入对应页面。

CDH大数据集群环境搭建步骤

CDH大数据集群环境搭建步骤

4、检查swappiness不能超过10cat /proc/sys/vm/swappiness如果超过10运行时执行echo 0 > /proc/sys/vm/swappiness保持重启之后继续生效vim /etc/sysctl.confvm.swappiness=05、设置下面内容echo never > /sys/kernel/mm/transparent_hugepage/defrag echo never > /sys/kernel/mm/transparent_hugepage/enabled为了重启之后也生效vim /etc/rc.local添加:echo never > /sys/kernel/mm/transparent_hugepage/defrag echo never > /sys/kernel/mm/transparent_hugepage/enabled二、安装准备1、准备cm包1、将cm包放到安装http服务的节点mkdir /opt/cmallkeys.asccloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpmcloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpmcloudera-manager-server-6.3.1-1466458.el7.x86_64.rpmcloudera-manager-server-db-2-6.3.1-1466458.el7.x86_64.rpm enterprise-debuginfo-6.3.1-1466458.el7.x86_64.rpmoracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm2、创建本地yum仓库createrepo .若createrepo命令未发现,需要安装createrepoyum -y install createrepo再次执行createrepo .3、在/etc/yum.repo.d/目录下增加cm.repo文件vim /etc/yum.repos.d/cm.repo添加以下内容:[cmrepo]name=CMbaseurl=http://hostname:9052/cmgpgcheck=falseenabled=true4、验证CM源是否配置成功yum repolist5、将cm.repo分发到其余各节点2、准备cdh parcel包1、mkdir/opt/cdh将parcel包放到文件夹CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcelCDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256manifest.json2、mkdir/opt/cdh/flink将flink parcel包放到该文件下FLINK-1.13.3-bin-scala-2.11-el7.parcelFLINK-1.13.3-bin-scala-2.11-el7.parcel.shamanifest.json3、将FLINK_ON_YARN-1.13.3.jar放到cm节点的/opt/cloudera/csd并修改文件夹权限sudo chown cloudera-scm:cloudera-scm/opt/cloudera/*3、在mysql创建数据库和用户并授权#scmCREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;CREATE USER 'scm'@'%' IDENTIFIED BY'password';GRANT ALL ON scm.* TO 'scm'@'%' ;FLUSH PRIVILEGES;#Activity MonitorCREATE DATABASE am DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;CREATE USER 'am'@'%' IDENTIFIED BY'password';GRANT ALL ON am.* TO 'am'@'%';FLUSH PRIVILEGES;#Reports ManagerCREATE DATABASE rm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;CREATE USER 'rm'@'%' IDENTIFIED BY'password';GRANT ALL ON rm.* TO 'rm'@'%' ;FLUSH PRIVILEGES;#HueCREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;CREATE USER 'hue'@'%' IDENTIFIED BY'password';GRANT ALL ON hue.* TO 'hue'@'%';FLUSH PRIVILEGES;#HiveCREATE DATABASE hive DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;CREATE USER 'hive'@'%' IDENTIFIED BY'password';GRANT ALL ON hive.* TO 'hive'@'%' ;FLUSH PRIVILEGES;#OozieCREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;CREATE USER 'oozie'@'%' IDENTIFIED BY'password';GRANT ALL ON oozie.* TO 'oozie'@'%' ;FLUSH PRIVILEGES;4、在cm节点配置jdbc驱动# mkdir -p /usr/share/java# mv mysql-connector-java-5.1.34.jar/usr/share/java/# cd /usr/share/java/# ln -s mysql-connector-java-5.1.34.jar mysql-connector-java.jar5、如果cms节点的/usr/java/default/下没有jdk,用下面方式安装yum -y install oracle-j2sdk1.8-1.8.0+update181-1三、安装1、安装 cloudera-manager-serveryum -y install cloudera-manager-server2、初始化cm数据库/opt/cloudera/cm/schema/scm_prepare_database.sh mysql scm scm password3、启动cm serversystemctl start cloudera-scm-server4、访问7180端口, admin admin配置parcel 路径:http://hostname:9052/cdh。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Cloudera大数据平台环境搭建(CDH5.13.1版)
目录
基础环境
软件环境
本文将介绍Centos7.4离线安装CDH和ClouderaManager过程,软件版本如下:
配置规划
本次安装共5台服务器,服务器配置及用途如下:
所需要的软件资源
1)JDK环境:
JDK版本:51
jdk-8u151-linux-x64.rpm
下载地址:
2)CM包:
CM版本:5.13.1
下载地址:
3)CDH包
CDH版本:5.13.1,

.sha1;
manifest.json
下载地址:
4)JDBC连接jar包:
jar包版本:5.1.43,
mysql-connector-java-5.1.43.jar
下载地址:
修改机器名(所有节点)
这种方式,在Centos7中可以永久性改变主机名称。

内容都改为:
设置防火墙(所有节点)
注:为了简便,可以先关闭防所有节点火墙,安装完成后,再按照下面步骤设置。

防火墙常用命令:
便,安装完毕后可以根据需要设置防火墙策略,保证集群安全。

配置免密码登录SSH
将子节点设置为从主节点ssh无密码登陆(主节点访问从节点需要无密码互通,否则后面会出现问题)
一路回车,生成无密码的密钥对。

把公钥拷贝至node169服务器上?:
登录到node169服务器上:
然后在node169服务器上,把公钥的内容追加到authorized_keys文件末尾(这个文件也在隐藏文件夹.ssh下,如果没有可以新建):
在node168节点出现下面表示成功登录node169节点:
以同样的方式将公钥拷贝至其他节点服务器上。

关闭SELINUX(所有节点)
关闭linuxSELINUX安全内核
(在Centos7中遇到SELINUX无法关闭的问题,重新启动机器恢复正常)
修改Linux内核参数(所有节点)
为避免安装过程中出现的异常问题,首先调整Linux内核参数。

1)设置swappiness,控制换出运行时内存的相对权重,Cloudera建议将swappiness设置为
10:
自CentOS6版本开始引入了TransparentHugePages(THP),从CentOS7版本开始,该特性默认就会启用。

尽管THP的本意是为提升内存的性能,不过某些数据库厂商还是建议直接关闭THP,否则可能会导致性能出现下降。

表示已禁用:
临时关闭(重启机器会变回默认开启状态):
重启系统,以后再检查THP状态,显示状态被禁用了。

3)修改文件句柄数:
修改后需要重启机器。

其他安装与配置(所有节点)
为避免安装过程中出现异常问题,安装相关依赖包:
配置NTP服务
集群中所有主机必须保持时间同步,如果时间相差较大会引起各种问题。

具体建设过程如下:
NTP服务端(主节点):
1)查找时间同步服务器:
打开网址,内容如下:
以面表明,chronyd显示为开机启动状态。

将chronyd设为禁用状态:
此时,NTP的服务开机自启动完成!
NTP客户端(所有从节点):
是NTP服务端IP,
安装oracleJDK1.8(所有节点)
下载rpm安装包jdk-8u151-linux-x64.rpm
查询java相关的包,使用
配置JAVA_HOME环境变量:
在profile文件最后,输入下面内容,保存并退出。

bashrc 件配置环境变量:
Mysql安装(主节点)
到官网选择对应安装包:
按common–>libs–>client–>server的顺序安装:
安装CM
传包,解包
在主节点上下载相关软件包,这里将软件包下载到/data/cdh/目录下。

创建数据库
在主节点上:
主节点/etc/hosts内容:
脚本/scm_prepare_database.sh执行成功界面:
创建用户
制作本地YUM源
在主节点上:
拷贝jar包
在主节点上:
修改cloudera-scm-agent配置
在主节点上,修改/opt/cm-5.13.1/etc/cloudera-scm-agent/config.ini文件:
在主节点上:
启动CMServer和Agent
在主节点上,启动cloudera-scm-server:
启动过程较慢,可通过/opt/cm-5.13.1/log/cloudera-scm-server日志,查看启动过程。

访问CM
地址:主节点IP:7180
用户名、密码:admin
安装CDH
登录后界面
接受协议:
选择CM版本
本文档选择ClouderaExpress免费版。

指定主机
在搜索主机名和IP地址框输入node[169-172],这里输入的内容支持正则表达式。

输入后点【搜索】按钮,出现机器列表:
选择“当前管理的主机“选择项卡,点【继续】。

选择CDH版本
这里需要选择制作本地源时的版本,如果选择别的版本的就会去官网下载,那样安装速度会很慢。

点【继续】按钮,进入安装界面。

出现“主机运行状态不良”错误
重新启动故障节点Agent服务:
注:出现故障原因是,因为我之前在故障节点启动过cloudera-scm-agent服务。

检查主机正确性
确保全部验证通过。

选择安装的服务
本文选择的是安装所有服务。

角色分配
这里应该根据实际需求和服务器的硬件参数自己选择
数据库设置
指定的数据库名称,要与2.2节创建的数据库(hive,monitor,oozie,hue)保持一致,并输入对应的数据库用户名和密码,为了简便这里用的是root账号名和密码。

全部输入完,之后【测试连接】:
测试连接报错:
测试连接,Hue测试报错:Unabletoverifydatabaseconnection:
原因是缺少Mysql mysql-community-libs-compat安装包,安装后,问题解决:
测试成功后,点【继续】安装。

群集设置
可以根据自己的实际情况更改设置,本文采用默认配置。

这些配置也可以在集群安装完成后再更改。

开始安装
安装过程没有任何错误,显示安装完成。

安装完成
第一次安装完成后,会出现一些配置的警告信息。

这些可以根据提示信息更改。

警告信息:
发现节点有异常信息,显示所有主机,发现node71节点运行状态不良。

按照主机->所有主机->进入节点查看:
选择“配置“页签,拉到页面底部,修改”主机时钟偏差阈值“,设为”从不“,点【保存更改】,异常消失。

常见错误
初始化数据库错误:
在这个环节,出现的问题较多,但总的来说,是与数据库参数配置,和帐号权限配置有关。

:Yourpassworddoesnotsatisfythecurrentpolicyrequirements
可以通过f配置文件关闭validate_password插件。

通过修改/etc/f目录下配置文件,修改设置密码策略的级别,只需要在[mysqld]下添加一行validate_password=off
如图所示:
编辑完配置文件后,重启mysqld服务即可生效。

未能连接到HostMonitor
后台tail-fcloudera-scm-server/cloudera-scm-server.log日志报错信息:
com.cloudera.cmon.MgmtServiceLocatorException:CouldnotfindaHOST_MONITORINGnozzlefromSCM.
此问题原因:有些网上说是由文件句柄数限制引起,所以按照网上说明进行了修改:
在主节点上,修改/opt/cm-5.13.1/etc/cloudera-scm-agent/config.ini文件:
//查看文件句柄数,显示1024,显然太小
#ulimit-n
1024
//修改限制
#vi/etc/security/limits.conf
//在文件后加入下面内容:
*softnofile100000
*hardnofile100000
注:按照上面过程操作,但问题依然存在,后来通过用3.4节中“主机运行状态不良”故障问题解决办法,问题得到解决。

相关文档
最新文档