云计算
一、环境准备
独立部署:官方建议的硬件要求至少为4C/16G
1台4核16G
台4核8G
1.1 :获取软件包
访问: https://bk.tencent.com/download/
1.2 :系统环境设置
官方建议:要求CentOS-7.0以上版本,推荐CentOS-7.5
安装常用的命令
[ root @ localhost~] # yum-yinstallvimlrzsznet-toolsntpwget
1.2.1 :关闭selinux
[root@localhost ~]# setenforce 0
#修改配置文件
[root@localhost~]#sed-ri\\\&; quot; s/selinux=enforcing/selinux=disabled/\\& amp; quot; /etc/selinux/confiing
1.2.2 :重新启动系统
[root@localhost ~]# reboot
1.2.3 :安装rsync
#检查是否存在rsync命令,如果存在返回rsync的路径,可以跳过下一个命令
[root@localhost ~]# which rsync
安装rsync
[ root @ localhost~] # yum-yinstallrsync
1.2.4 :关闭防火墙
#如果检查缺省防火墙状态并返回not running,则可以跳过以下命令
[ root @ localhost~~ ] # firewall-cmd-- state
停止并禁用防火墙d :
[ root @ localhost~] #停止systemctlstopfirewalld # firewall d
[ root @ localhost~] #禁用systemctldisablefirewalld # firewall的启动
1.2.5 :调整最大文件打开数
#检查当前根帐户下的最大打开文件值
[root@localhost ~]# ulimit -n
#默认值为1024时,建议更改配置文件以将其调整为102400或更高。
[ root @ localhost~] # vim/etc/security/limits.d/99-nofile.conf
根软件文件102400
根硬件文件102400
请自行调整此处使用的个别设定档,以复写/etc/security/limits.conf的预设值。
更改后,重新使用root登录检查是否有效
[root@localhost ~]# su
[root@localhost ~]# ulimit -n
1.2.6 :时间同步
如果服务器后台时间不同步,会给时间敏感的服务带来意外的结果。 安装和使用蓝鲸时,请务必同步时间。
#检查每台机器的当前时间和时区是否一致,如果相互之间的差异大于3s (考虑批量运行时的时差),则建议学校时间。
[ root @ localhost~~ ] # yum-yinstallntp
[root@localhost ~]# date -R
查看与ntpd服务器的时间差(需要访问外部网。 如果内部网中有ntpd服务器,请自己用该服务器的地址替换域名。)。
[ root @ localhost~] # ntpdate-DCN.pool.NTP.org
#如果输出的最后一行中的offset大于1s,则建议使用学校
与ntp服务器同步时间
[ root @ localhost~] # ntpdate cn.pool.NTP.org
1.2.7 :检查全局HTTP代理是否存在
如果存在http代理,并且无法正确代理这些请求,介于蓝鲸之间的http请求将会发生意外错误。
http_proxy https_proxy变量可以检查是否被设置,并且如果空则跳过后面的操作
[ root @ localhost~] # echo $ http _ proxy $ https _ proxy
要将http_proxy变量设置为本机,请按顺序搜索/etc/profile、/etc/bashrc、$HOME/.bashrc等文件中是否存在设置。
1.2.8 :关闭网络管理器
查看网络管理器的状态
[ root @ localhost~] # systemctlstatusnetworkmanager.service
关闭网络管理器
[ root @ localhost~] # systemctlstopnetworkmanager.service
将网络管理器服务设置为不启动
[ root @ localhost~] # systemctldisablenetworkmanager.service
1.3 :配置yum源
1.3.1 :获取base源代码
#备份默认源
[ root @ localhost~] # mv/etc/yum.repos.d/centos-base.repo/etc/yum.repos.d/centos-base.repo.base
#获取网络源
[ root @ localhost~] # wget-o/etc/yum.repos.d/centos-base.repo http://mirrors.cloud.Tencent.com/repo /
1.3.2 :获取epel源
[ root @ localhost~] # wget-o/etc/yum.repos.d/epel.repo http://mirrors.cloud.Tencent.com/repo/epel-7
#更新缓存
[root@localhost ~]# yum clean all
[root@localhost ~]# yum makecache
1.4 :获得证书
3359 bk.Tencent.com/download _ SSL /
通过命令获得本机的Mac地址,复制到上述网址下载证书文件
2、安装前准备
2.1 )解压缩软件包
#将软件包上载到服务器并解压缩到/data目录
[root@localhost ~]# mkdir /data
[ root @ localhost~] # tar-xfbkce _ src-5.0.4.tar.gz-c/data /
#解压缩后/data目录下有两个目录install和src
解压缩SSL证书文件
[ root @ localhost~] # tar-xf SSL _ certificates.tar.gz-c/data/src/cert /
2.2 :修改配置文件
2.2.1:install.conf
install.config是模块和服务器之间的对应关系配置文件,用于描述要在哪些计算机上安装的模块。 各行2列、第1列是IP地址; 第二列是用英语逗号分隔的模块名称。
[ root @ localhost~] # CD/data/install /
[ root @ localhost install ] # CP install.config.3ip.sample install.config
[ root @ localhost install ] # vim install.config
注意:这里云服务器写公共网络ip
[ root @ localhost install ] # curl IP.sb
[ root @ localhost install ] # vim globals.env
下面的域名根据实际情况修改为自己的
export bk _ domain=bk.cloud.Tencent.com #蓝鲸的根域名(主机名除外)
export PAAs _ FQDN=yp PAAs.$ bk _ domain # PAAs完整域名
export CMDB _ FQDN=ypc MDB.$ bk _ domain # CMDB完整域名
export job _ FQDN=yp job.$ bk _ domain # job完整域名
PAAS_ADMIN_PASS为` BWvQEaYO `修正
剩下的可以默认
2.2.3:pip.conf
[ root @ localhost~] # mkdir-p/data/src/. pip /
[ root @ localhost~] # vim/data/src/. pip/pip.conf
[global]
索引- URL=! img://c:\\\ & amp; quot; users\\\\&; quot; lfl\\\&; quot; appdata\\\\&; quot; local\\\\&; quot; temp\\\&; quot;
[ root @ localhost~] # curl-I http://mirrors.cloud.Tencent.com/pypi/simple
2.3 )设置无密集登录
[ root @ localhost~] # CD/data/install /
按照[ root @ localhost install ] # bash configure _ ssh _ without _ pass #提示符输入每台主机的超级用户密码,完成密集自由登录配置
2.4 :安装前检查环境
[ root @ localhost~] # CD/data/install /
[ root @ localhost install ] # bashprecheck.sh
通常如下图所示
如果发现[FAIL]错误,请按照提示和本手册进行修正。 修复后,您可以继续运行precheck.sh脚本,直到不再显示“[FAIL]”。 如果需要从头开始检查,请使用precheck.sh -r参数
3 .开始安装
3.1 :执行安装
[ root @ localhost~] # mkdir/usr/local/blue king
[ root @ localhost~] # CD/data/install /
[ root @ localhost install ] #./install _ mini bk-y
……
check _ networkmanagerhasbeencheckedsuccessfully . skip
check _ firewalldhasbeencheckedsuccessfully . skip
wheredoyouwanttoinstallbluekingproducts。
enter a absolute path [/data/bkce] :直接返回滑架进行确定
……
enteraabsolutepath [/data/bkce ]:/usr/local/blue king #输入要安装的位置
directory/usr/local/blue king exists,areyousuretoinstallbluekingsuiteto/usr/local/blue king,yes/no? 是
发生错误:
parse cc response error分析cc错误
解决方案:
正式给予
[ root @ localhost~] # source/data/install/utils.fc
[ root @ localhost~] # CD/data/install
[ root @ localhost install ] #./bkcecstatusall
[ root @ localhost install ] #./bkcecstopgse
[ root @ localhost install ] #./bkcecinstallgse 1
[ root @ localhost install ] #./bkcecinitdatagse
重新执行安装
[ root @ localhost install ] #./install _ mini bk-y
4、进入页面
windows :修改主机文件以解析域名
c\\\\&; quot; windows\\&; quot; system32\\&; quot; \&; quot; 驱动程序\\& amp; quot; \&; quot; etc\\&; quot; \&; quot; 主机
192.168.66.35 localhost.local domain
192.168.66.35 yppaas.bk.com
192.168.66.35 ypcmdb.bk.com
192.168.66.35 ypjob.bk.com
192.168.66.35 rbtnode1
注意:登录的用户名和密码是在配置文件globals.env中设置的
一般用户是admin,密码是自己更改的密码
5、部署网络管理
5.1 :下载插件软件包
下载第三方网络管理平台
插件包地址https://bk.Tencent.com/download _ SDK /
5.2 )解压缩安装
#先运行环境变量文件
[ root @ rbt node1~ ] # source/data/install/globals.env
#上传插件软件包并解压缩安装
[ root @ rbt node1~ ] # tarxfbknetwork.tgz-c/data/src /
[ root @ rbt node 1至] # tar xf/data/src/bk network/bk network-3.6.1.tgz-c/data/src /
[ root @ rbt node1~~] # rsync-a/data/src/bk network/install//data/install /
5.3 )根据情况更改域名
根据情况修改中央控制台/data/install/third/globals _ bk network.env网络管理域名等信息
5.4 :部署网络管理
[ root @ rbt node1~ ] # CD/data/install /
[ root @ rbt node1install ] #./bkco _ installbknetwork
5.5 )在win系统中添加域名解析
windows :修改主机文件以解析域名
c\\\\&; quot; windows\\&; quot; system32\\&; quot; \&; quot; 驱动程序\\& amp; quot; \&; quot; etc\\&; quot; \&; quot; 主机
192.168.66.35 bknetwork.bk.com
5.6 :访问页面
http://bknetwork.bk.com
6、引进CICD插件
6.1 :下载插件软件包和脚本
3359 bk.Tencent.com/download _ SDK /
6.2 )解压缩安装
[ root @ rbt node1~ ] # tar-xfbkce _ cicd kit-1.0.0.tgz-c/data
[ root @ rbt node1~ ] # tar-xf install _ ce-cicdkit _ fix-1.0.2.tar-c/data
注:安装CICDKit的计算机上的可用配置不能少于4C8G,系统版本不能少于CentOS7.0。 建议在每台机器上部署
6.3 :修改配置
中央控制台install/third/globals _ cicdkit.env域名信息( CICDKIT_FQDN ) ) ) ) ) ) ) ) ) ) ) ) ) )。
install.config添加了cicdkit及其依赖的mysql5.7配置
[ root @ rbt node1install ] # vim install.config
192.168.66.36 Mysql57,cicdkit
6.4:cicdkit后台安装
#请先更新环境变量
[ root @ rbt node1install ] # source globals.env
[ root @ rbt node1install ] # source/data/install/third/globals _ cicdkit.env
#设置无安全,复制私钥:
[ root @ rbt node1install ] # ssh-copy-id root @ 192.168.66.36
将数据复制到cicd服务器
[ root @ rbt node1install ] #./bkcecsyncall
安装CICDKit
[ root @ rbt node1install ] #./bkco _ installcicdkit
[ root @ rbt node1~ ] # source/data/install/utils.fc
[ root @ rbt node1install ] # echo $ cicdkit _ FQDN
cicdkit.bk.com
[ root @ rbt node1install ] # vim/etc/hosts
10.18.198.92 cicdkit.bk.com
#重新启动进程
[ root @ rbt node1install ] #./bkcecstopcicdkitself
[ root @ rbt node1install ] #./bkcecstartcicdkitself
6.5:cicdkit-SaaS部署
下载cicdkit-SaaS软件包
3359 bk.Tencent.com/s-mart/application/159/detail
从PaaS页面访问和部署开发人员中心
6.6 :访问页面
7、服务器重启后的操作
确保/etc/resolv.conf中的第一个nameserver为127.0.0.1,并确保选项选项中没有rotate
重新启动机器的crontab,检查是否存在自动提升进程的配置crontab -l | grep process_watch,重新启动后的自动提升主要依靠crontab
在中央控制台中检查所有进程的状态。/bkcec status all,正常情况下应该都能正常提升运行状态。 如果有EXIT,尝试手动提起。 手动提升的具体方法参考组件的启动和停止https://docs.bk.Tencent.com/bkce _ install _ guide/maintain.html # start _ stop
如果社区版的所有机器同时重新启动,很多进程启动失败的概率会很高。 由于无法控制在不同的计算机上恢复组件的时间,因此依赖的组件还没有启动,将失败并产生连锁反应。 因此,在这种情况下,请遵循和安装时启动的原则。
先启动数据库
启动其他依赖的开放源代码组件和服务
启动蓝鲸产品
如果已经部署了SaaS,请手动提起。
[ root @ rbt node1~ ] # CD/data/install /
[ root @ rbt node1install ] #./bkcecstartsaas-o #正式环境
[ root @ rbt node1install ] #./bkcecstartsaas-t #测试环境
#检查所有服务的启动状态,一切运行正常,如有EXIT手动提升
[ root @ rbt node1install ] #./bkcecstatusall
#手动提升服务。 范例
[ root @ rbt node1install ] #./bkcecstartbknetwork
[ root @ rbt node1install ] #./bkcecstatusbknetwork
8、离线安装代理
8.1 :离线准备
下载已包含安装agent所需软件的ISO镜像文件
3359 bk.Tencent.com/s-mart/community/question/466
在每台计算机上装载:
mkdir -p /mnt/centos7
mount /dev/sr0 /mnt/centos7
8.2 :配置脱机repo
vim/etc/yum.repos.d/offline-centos7. repo
[offline-centos7]
name=Bk repo
baseurl=file:///mnt/centos7
启用=1
gpgcheck=0
8.3 :更新缓存
yum clean all
yum makecache
yum repolist
8.4 :在节点配置中添加代理即可
9、常见问题总结
9.1:zookpeer启动失败
确认日志中存在脏数据,日志路径
[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/data/version-2/
[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/datalog/version-2/
[ root @ rbt node1~ ] # CD/data/install
[ root @ rbt node1install ] #./bkcecstartzk
[ root @ rbt node1install ] #./bkcecstatuszk
确认日志中存在脏数据,日志路径
[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/data/version-2/
[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/datalog/version-2/
[ root @ rbt node1~ ] # CD/data/install
[ root @ rbt node1install ] #./bkcecstartzk
[ root @ rbt node1install ] #./bkcecstatuszk
9.2:GSE启动失败
重新启动gse
[ root @ rbt node1~ ] # CD/data/install
[ root @ rbt node1install ] #./bkcecstopgse 1
[ root @ rbt node1install ] #./bkcecinitdatagse
[ root @ rbt node1install ] #./bkcecstartgse
[ root @ rbt node1install ] #./bkcecstatusgse
9.3 )服务器的gse服务正常和不正常
日志显示无法连接到Redis主机,但Redis服务正常,根本原因是将Redis和gse放入同一台服务器中进行安装
9.4 )重新启动服务后,访问SaaS APP都报502
原因:重新启动服务后,还有剩余的进程
解决方案:在开发人员中心重新部署这些APP应用程序
9.5 )更改Redis密码不能有特殊字符。 如果有特殊字符,gse_dba服务将不再出现,并且所有cmdb服务都将无法运行
参考官方网站: http://docs.bk.Tencent.com/bkce _ maintain _ FAQ/component/redis.html恢复正常密码,解决问题
9.6 )引入蓝鲸平台时出错的add rabbitmq user admin failed
在目录/etc/rabbitmq中命令chmod 755 *
9.7 )卸载蓝鲸失败。 提示:组件调用异常,
安装服务器后,业务将分配给其他位置,为了避免卸载失败,必须再次将主机分配给蓝鲸业务并重新安装代理
9.8 )蓝鲸服务器重新启动后,会出现无法访问所有app的情况,paas_agent不会显示运行状态
执行命令:
查看日志/data/bkce/logs/PAAs _ agent/agent.log
./bkcec stop nginx
./bkcec start nginx
./bkcec stop appt
./bkcec start appt
./bkcec stop appo
./bkcec start appo
之后,重新上下移动uam,重新上下移动APP,问题得到解决。
9.9 )表示bkdata服务器detect_cron不正常
原因: crontab计划任务格式不正确,包含很多@编号。 请删除@编号,然后运行以下命令解决问题
工作监视器
supervisor CTL-c/data/bkce/etc/supervisor-bk data-monitor.confrestartdetect _ cron
9.10 :自动app部署配置失败,日志报告错误,找不到pip源
在appt和appo服务器上分别执行以下操作,以提前在在线pip环境中安装pip包
pipdownloaddjango-celery==3.1. 16,然后上载到/data/bkce/PAAs _ agent/support-files/pkgs /目录;
针对/data/bkcd/pass _ agent/apps/projects/cc-automation/cc-automation/requirements.txt中的依赖包版本信息
在APP虚拟环境中安装从属软件包:
CD/data/bkce/PAAs _ agent/apps/envs/cc-automation/bin
源活动
pip insallr/data/bkce/pass _ agent/apps/projects/cc-automation/cc-automation/requirements.txt
pip list
降级
10、如何在单个SaaS APP中添加白名单
官方文件: https://bk.Tencent.com/s-mart/community/question/569
11、手动卸载每个节点代理
登录到每个管理节点服务器,执行以下操作
停止gse_agent :
[ root @ node1~ ] #/usr/local/GSE/agent/bin/gsectlstop
停止收集器:
[ root @ node1~ ] # CD/usr/local/GSE/plugins/bin/./stop.shbasereport
删除GSE相关目录
[ root @ node1~ ] # RM-RF/usr/local/GSE//var/log/GSE//var/run/GSE//var/lib/GSE /
详情请访问云服务器、域名注册、虚拟主机的问题,请访问西部数码代理商官方网站: www.chenqinet.cn