陈奇网络工作室

网络管理部署

云计算

一、环境准备

独立部署:官方建议的硬件要求至少为4C/16G

1台4核16G

台4核8G

1.1 :获取软件包

访问: https://bk.tencent.com/download/

1.2 :系统环境设置

官方建议:要求CentOS-7.0以上版本,推荐CentOS-7.5

安装常用的命令

[ root @ localhost~] # yum-yinstallvimlrzsznet-toolsntpwget

1.2.1 :关闭selinux

[root@localhost ~]# setenforce 0

#修改配置文件

[root@localhost~]#sed-ri\\\& quot; s/selinux=enforcing/selinux=disabled/\\& amp; quot; /etc/selinux/confiing

1.2.2 :重新启动系统

[root@localhost ~]# reboot

1.2.3 :安装rsync

#检查是否存在rsync命令,如果存在返回rsync的路径,可以跳过下一个命令

[root@localhost ~]# which rsync

安装rsync

[ root @ localhost~] # yum-yinstallrsync

1.2.4 :关闭防火墙

#如果检查缺省防火墙状态并返回not running,则可以跳过以下命令

[ root @ localhost~~ ] # firewall-cmd-- state

停止并禁用防火墙d :

[ root @ localhost~] #停止systemctlstopfirewalld # firewall d

[ root @ localhost~] #禁用systemctldisablefirewalld # firewall的启动

1.2.5 :调整最大文件打开数

#检查当前根帐户下的最大打开文件值

[root@localhost ~]# ulimit -n

#默认值为1024时,建议更改配置文件以将其调整为102400或更高。

[ root @ localhost~] # vim/etc/security/limits.d/99-nofile.conf

根软件文件102400

根硬件文件102400

请自行调整此处使用的个别设定档,以复写/etc/security/limits.conf的预设值。

更改后,重新使用root登录检查是否有效

[root@localhost ~]# su

[root@localhost ~]# ulimit -n

1.2.6 :时间同步

如果服务器后台时间不同步,会给时间敏感的服务带来意外的结果。 安装和使用蓝鲸时,请务必同步时间。

#检查每台机器的当前时间和时区是否一致,如果相互之间的差异大于3s (考虑批量运行时的时差),则建议学校时间。

[ root @ localhost~~ ] # yum-yinstallntp

[root@localhost ~]# date -R

查看与ntpd服务器的时间差(需要访问外部网。 如果内部网中有ntpd服务器,请自己用该服务器的地址替换域名。)。

[ root @ localhost~] # ntpdate-DCN.pool.NTP.org

#如果输出的最后一行中的offset大于1s,则建议使用学校

与ntp服务器同步时间

[ root @ localhost~] # ntpdate cn.pool.NTP.org

1.2.7 :检查全局HTTP代理是否存在

如果存在http代理,并且无法正确代理这些请求,介于蓝鲸之间的http请求将会发生意外错误。

http_proxy https_proxy变量可以检查是否被设置,并且如果空则跳过后面的操作

[ root @ localhost~] # echo $ http _ proxy $ https _ proxy

要将http_proxy变量设置为本机,请按顺序搜索/etc/profile、/etc/bashrc、$HOME/.bashrc等文件中是否存在设置。

1.2.8 :关闭网络管理器

查看网络管理器的状态

[ root @ localhost~] # systemctlstatusnetworkmanager.service

关闭网络管理器

[ root @ localhost~] # systemctlstopnetworkmanager.service

将网络管理器服务设置为不启动

[ root @ localhost~] # systemctldisablenetworkmanager.service

1.3 :配置yum源

1.3.1 :获取base源代码

#备份默认源

[ root @ localhost~] # mv/etc/yum.repos.d/centos-base.repo/etc/yum.repos.d/centos-base.repo.base

#获取网络源

[ root @ localhost~] # wget-o/etc/yum.repos.d/centos-base.repo http://mirrors.cloud.Tencent.com/repo /

1.3.2 :获取epel源

[ root @ localhost~] # wget-o/etc/yum.repos.d/epel.repo http://mirrors.cloud.Tencent.com/repo/epel-7

#更新缓存

[root@localhost ~]# yum clean all

[root@localhost ~]# yum makecache

1.4 :获得证书

3359 bk.Tencent.com/download _ SSL /

通过命令获得本机的Mac地址,复制到上述网址下载证书文件

2、安装前准备

2.1 )解压缩软件包

#将软件包上载到服务器并解压缩到/data目录

[root@localhost ~]# mkdir /data

[ root @ localhost~] # tar-xfbkce _ src-5.0.4.tar.gz-c/data /

#解压缩后/data目录下有两个目录install和src

解压缩SSL证书文件

[ root @ localhost~] # tar-xf SSL _ certificates.tar.gz-c/data/src/cert /

2.2 :修改配置文件

2.2.1:install.conf

install.config是模块和服务器之间的对应关系配置文件,用于描述要在哪些计算机上安装的模块。 各行2列、第1列是IP地址; 第二列是用英语逗号分隔的模块名称。

[ root @ localhost~] # CD/data/install /

[ root @ localhost install ] # CP install.config.3ip.sample install.config

[ root @ localhost install ] # vim install.config

注意:这里云服务器写公共网络ip

[ root @ localhost install ] # curl IP.sb

[ root @ localhost install ] # vim globals.env

下面的域名根据实际情况修改为自己的

export bk _ domain=bk.cloud.Tencent.com #蓝鲸的根域名(主机名除外)

export PAAs _ FQDN=yp PAAs.$ bk _ domain # PAAs完整域名

export CMDB _ FQDN=ypc MDB.$ bk _ domain # CMDB完整域名

export job _ FQDN=yp job.$ bk _ domain # job完整域名

PAAS_ADMIN_PASS为` BWvQEaYO `修正

剩下的可以默认

2.2.3:pip.conf

[ root @ localhost~] # mkdir-p/data/src/. pip /

[ root @ localhost~] # vim/data/src/. pip/pip.conf

[global]

索引- URL=! img://c:\\\ & amp; quot; users\\\\& quot; lfl\\\& quot; appdata\\\\& quot; local\\\\& quot; temp\\\& quot;

[ root @ localhost~] # curl-I http://mirrors.cloud.Tencent.com/pypi/simple

2.3 )设置无密集登录

[ root @ localhost~] # CD/data/install /

按照[ root @ localhost install ] # bash configure _ ssh _ without _ pass #提示符输入每台主机的超级用户密码,完成密集自由登录配置

2.4 :安装前检查环境

[ root @ localhost~] # CD/data/install /

[ root @ localhost install ] # bashprecheck.sh

通常如下图所示

如果发现[FAIL]错误,请按照提示和本手册进行修正。 修复后,您可以继续运行precheck.sh脚本,直到不再显示“[FAIL]”。 如果需要从头开始检查,请使用precheck.sh -r参数

3 .开始安装

3.1 :执行安装

[ root @ localhost~] # mkdir/usr/local/blue king

[ root @ localhost~] # CD/data/install /

[ root @ localhost install ] #./install _ mini bk-y

……

check _ networkmanagerhasbeencheckedsuccessfully . skip

check _ firewalldhasbeencheckedsuccessfully . skip

wheredoyouwanttoinstallbluekingproducts。

enter a absolute path [/data/bkce] :直接返回滑架进行确定

……

enteraabsolutepath [/data/bkce ]:/usr/local/blue king #输入要安装的位置

directory/usr/local/blue king exists,areyousuretoinstallbluekingsuiteto/usr/local/blue king,yes/no? 是

发生错误:

parse cc response error分析cc错误

解决方案:

正式给予

[ root @ localhost~] # source/data/install/utils.fc

[ root @ localhost~] # CD/data/install

[ root @ localhost install ] #./bkcecstatusall

[ root @ localhost install ] #./bkcecstopgse

[ root @ localhost install ] #./bkcecinstallgse 1

[ root @ localhost install ] #./bkcecinitdatagse

重新执行安装

[ root @ localhost install ] #./install _ mini bk-y

4、进入页面

windows :修改主机文件以解析域名

c\\\\& quot; windows\\& quot; system32\\& quot; \& quot; 驱动程序\\& amp; quot; \& quot; etc\\& quot; \& quot; 主机

192.168.66.35 localhost.local domain

192.168.66.35 yppaas.bk.com

192.168.66.35 ypcmdb.bk.com

192.168.66.35 ypjob.bk.com

192.168.66.35 rbtnode1

注意:登录的用户名和密码是在配置文件globals.env中设置的

一般用户是admin,密码是自己更改的密码

5、部署网络管理

5.1 :下载插件软件包

下载第三方网络管理平台

插件包地址https://bk.Tencent.com/download _ SDK /

5.2 )解压缩安装

#先运行环境变量文件

[ root @ rbt node1~ ] # source/data/install/globals.env

#上传插件软件包并解压缩安装

[ root @ rbt node1~ ] # tarxfbknetwork.tgz-c/data/src /

[ root @ rbt node 1至] # tar xf/data/src/bk network/bk network-3.6.1.tgz-c/data/src /

[ root @ rbt node1~~] # rsync-a/data/src/bk network/install//data/install /

5.3 )根据情况更改域名

根据情况修改中央控制台/data/install/third/globals _ bk network.env网络管理域名等信息

5.4 :部署网络管理

[ root @ rbt node1~ ] # CD/data/install /

[ root @ rbt node1install ] #./bkco _ installbknetwork

5.5 )在win系统中添加域名解析

windows :修改主机文件以解析域名

c\\\\& quot; windows\\& quot; system32\\& quot; \& quot; 驱动程序\\& amp; quot; \& quot; etc\\& quot; \& quot; 主机

192.168.66.35 bknetwork.bk.com

5.6 :访问页面

http://bknetwork.bk.com

6、引进CICD插件

6.1 :下载插件软件包和脚本

3359 bk.Tencent.com/download _ SDK /

6.2 )解压缩安装

[ root @ rbt node1~ ] # tar-xfbkce _ cicd kit-1.0.0.tgz-c/data

[ root @ rbt node1~ ] # tar-xf install _ ce-cicdkit _ fix-1.0.2.tar-c/data

注:安装CICDKit的计算机上的可用配置不能少于4C8G,系统版本不能少于CentOS7.0。 建议在每台机器上部署

6.3 :修改配置

中央控制台install/third/globals _ cicdkit.env域名信息( CICDKIT_FQDN ) ) ) ) ) ) ) ) ) ) ) ) ) )。

install.config添加了cicdkit及其依赖的mysql5.7配置

[ root @ rbt node1install ] # vim install.config

192.168.66.36 Mysql57,cicdkit

6.4:cicdkit后台安装

#请先更新环境变量

[ root @ rbt node1install ] # source globals.env

[ root @ rbt node1install ] # source/data/install/third/globals _ cicdkit.env

#设置无安全,复制私钥:

[ root @ rbt node1install ] # ssh-copy-id root @ 192.168.66.36

将数据复制到cicd服务器

[ root @ rbt node1install ] #./bkcecsyncall

安装CICDKit

[ root @ rbt node1install ] #./bkco _ installcicdkit

[ root @ rbt node1~ ] # source/data/install/utils.fc

[ root @ rbt node1install ] # echo $ cicdkit _ FQDN

cicdkit.bk.com

[ root @ rbt node1install ] # vim/etc/hosts

10.18.198.92 cicdkit.bk.com

#重新启动进程

[ root @ rbt node1install ] #./bkcecstopcicdkitself

[ root @ rbt node1install ] #./bkcecstartcicdkitself

6.5:cicdkit-SaaS部署

下载cicdkit-SaaS软件包

3359 bk.Tencent.com/s-mart/application/159/detail

从PaaS页面访问和部署开发人员中心

6.6 :访问页面

7、服务器重启后的操作

确保/etc/resolv.conf中的第一个nameserver为127.0.0.1,并确保选项选项中没有rotate

重新启动机器的crontab,检查是否存在自动提升进程的配置crontab -l | grep process_watch,重新启动后的自动提升主要依靠crontab

在中央控制台中检查所有进程的状态。/bkcec status all,正常情况下应该都能正常提升运行状态。 如果有EXIT,尝试手动提起。 手动提升的具体方法参考组件的启动和停止https://docs.bk.Tencent.com/bkce _ install _ guide/maintain.html # start _ stop

如果社区版的所有机器同时重新启动,很多进程启动失败的概率会很高。 由于无法控制在不同的计算机上恢复组件的时间,因此依赖的组件还没有启动,将失败并产生连锁反应。 因此,在这种情况下,请遵循和安装时启动的原则。

先启动数据库

启动其他依赖的开放源代码组件和服务

启动蓝鲸产品

如果已经部署了SaaS,请手动提起。

[ root @ rbt node1~ ] # CD/data/install /

[ root @ rbt node1install ] #./bkcecstartsaas-o #正式环境

[ root @ rbt node1install ] #./bkcecstartsaas-t #测试环境

#检查所有服务的启动状态,一切运行正常,如有EXIT手动提升

[ root @ rbt node1install ] #./bkcecstatusall

#手动提升服务。 范例

[ root @ rbt node1install ] #./bkcecstartbknetwork

[ root @ rbt node1install ] #./bkcecstatusbknetwork

8、离线安装代理

8.1 :离线准备

下载已包含安装agent所需软件的ISO镜像文件

3359 bk.Tencent.com/s-mart/community/question/466

在每台计算机上装载:

mkdir -p /mnt/centos7

mount /dev/sr0 /mnt/centos7

8.2 :配置脱机repo

vim/etc/yum.repos.d/offline-centos7. repo

[offline-centos7]

name=Bk repo

baseurl=file:///mnt/centos7

启用=1

gpgcheck=0

8.3 :更新缓存

yum clean all

yum makecache

yum repolist

8.4 :在节点配置中添加代理即可

9、常见问题总结

9.1:zookpeer启动失败

确认日志中存在脏数据,日志路径

[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/data/version-2/

[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/datalog/version-2/

[ root @ rbt node1~ ] # CD/data/install

[ root @ rbt node1install ] #./bkcecstartzk

[ root @ rbt node1install ] #./bkcecstatuszk

确认日志中存在脏数据,日志路径

[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/data/version-2/

[root@rbtnode1 ~]# rm -rf /安装目录/public/zk/datalog/version-2/

[ root @ rbt node1~ ] # CD/data/install

[ root @ rbt node1install ] #./bkcecstartzk

[ root @ rbt node1install ] #./bkcecstatuszk

9.2:GSE启动失败

重新启动gse

[ root @ rbt node1~ ] # CD/data/install

[ root @ rbt node1install ] #./bkcecstopgse 1

[ root @ rbt node1install ] #./bkcecinitdatagse

[ root @ rbt node1install ] #./bkcecstartgse

[ root @ rbt node1install ] #./bkcecstatusgse

9.3 )服务器的gse服务正常和不正常

日志显示无法连接到Redis主机,但Redis服务正常,根本原因是将Redis和gse放入同一台服务器中进行安装

9.4 )重新启动服务后,访问SaaS APP都报502

原因:重新启动服务后,还有剩余的进程

解决方案:在开发人员中心重新部署这些APP应用程序

9.5 )更改Redis密码不能有特殊字符。 如果有特殊字符,gse_dba服务将不再出现,并且所有cmdb服务都将无法运行

参考官方网站: http://docs.bk.Tencent.com/bkce _ maintain _ FAQ/component/redis.html恢复正常密码,解决问题

9.6 )引入蓝鲸平台时出错的add rabbitmq user admin failed

在目录/etc/rabbitmq中命令chmod 755 *

9.7 )卸载蓝鲸失败。 提示:组件调用异常,

安装服务器后,业务将分配给其他位置,为了避免卸载失败,必须再次将主机分配给蓝鲸业务并重新安装代理

9.8 )蓝鲸服务器重新启动后,会出现无法访问所有app的情况,paas_agent不会显示运行状态

执行命令:

查看日志/data/bkce/logs/PAAs _ agent/agent.log

./bkcec stop nginx

./bkcec start nginx

./bkcec stop appt

./bkcec start appt

./bkcec stop appo

./bkcec start appo

之后,重新上下移动uam,重新上下移动APP,问题得到解决。

9.9 )表示bkdata服务器detect_cron不正常

原因: crontab计划任务格式不正确,包含很多@编号。 请删除@编号,然后运行以下命令解决问题

工作监视器

supervisor CTL-c/data/bkce/etc/supervisor-bk data-monitor.confrestartdetect _ cron

9.10 :自动app部署配置失败,日志报告错误,找不到pip源

在appt和appo服务器上分别执行以下操作,以提前在在线pip环境中安装pip包

pipdownloaddjango-celery==3.1. 16,然后上载到/data/bkce/PAAs _ agent/support-files/pkgs /目录;

针对/data/bkcd/pass _ agent/apps/projects/cc-automation/cc-automation/requirements.txt中的依赖包版本信息

在APP虚拟环境中安装从属软件包:

CD/data/bkce/PAAs _ agent/apps/envs/cc-automation/bin

源活动

pip insallr/data/bkce/pass _ agent/apps/projects/cc-automation/cc-automation/requirements.txt

pip list

降级

10、如何在单个SaaS APP中添加白名单

官方文件: https://bk.Tencent.com/s-mart/community/question/569

11、手动卸载每个节点代理

登录到每个管理节点服务器,执行以下操作

停止gse_agent :

[ root @ node1~ ] #/usr/local/GSE/agent/bin/gsectlstop

停止收集器:

[ root @ node1~ ] # CD/usr/local/GSE/plugins/bin/./stop.shbasereport

删除GSE相关目录

[ root @ node1~ ] # RM-RF/usr/local/GSE//var/log/GSE//var/run/GSE//var/lib/GSE /

详情请访问云服务器、域名注册、虚拟主机的问题,请访问西部数码代理商官方网站: www.chenqinet.cn

相关推荐

后台-系统设置-扩展变量-手机广告位-内容页底部广告位3