Rancher2.0部署过程中常见问题分析与解决方法
本篇文章给大家分享的是有关Rancher 2.0部署过程中常见问题分析与解决方法,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
在荣县等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供成都网站制作、网站设计 网站设计制作按需设计,公司网站建设,企业网站建设,品牌网站制作,营销型网站,成都外贸网站制作,荣县网站建设费用合理。
Rancher 2.0部署与使用过程中常见的问题及其解决方法,多数问题整理收集自Rancher官方技术交流群内用户的提问与反馈。环境需求
推荐使用的操作系统
Ubuntu 16.04 (64-bit)
Red Hat Enterprise Linux 7.5 (64-bit)
RancherOS 1.3.0 (64-bit)
推荐的硬件配置
支持的docker版本
1.12.6
1.13.1
17.03.02
防火墙请允许通过已下端口
常见问题与排查思路
环境信息残留
目前部署中,大部分问题都是因为由于部署环境的操作系统,或多次部署,升级后残留的的信息造成的。
部署前或部署时,请使用以下命令将环境的各类信息清理干净:
df -h|grep kubelet |awk -F % '{print $2}'|xargs umount rm /var/lib/kubelet/* -rf rm /etc/kubernetes/* -rf rm /var/lib/rancher/* -rf rm /var/lib/etcd/* -rf rm /var/lib/cni/* -rf iptables -F && iptables -t nat –F ip link del flannel.1 docker ps -a|awk '{print $1}'|xargs docker rm -f docker volume ls|awk '{print $2}'|xargs docker volume rm
openssh版本过低问题
centos或rhel系统并且版本低于7.4的,因为默认的openssh和openssl和红帽系ssh默认将AllowTcpForwarding 关闭了,rke部署时会出现如下问题:
参考issue:
https://github.com/rancher/rke/issues/93
需要您进行以下操作:
确保您的openssh版本大于等于7.x
修改sshd配置打开重启sshd
默认centos和rhel不能使用root用户进行ssh tunnel,所以需要使用一个普通用户
并将这个用户加入docker这个Group,useradd –G docker yourusername
nodeport端口只有一台机器能访问
只能访问一台宿主机的nodeport,并且还是pod所在那台机器,出现这种问题很大原因是因为跨集群网络有问题,或本地防火墙问题。排查思路如下:
1、在宿主机本机telnet localhost:nodeort看看是否能通,本机能通,在集群内互相telnet测试,如果不能通根部署环境网络有很大关系,建议联系网络管理员进行排查。
如果本机telnet也不能通,进行如下测试。
2、首先我们需要或取对应的pod 信息
比如我这个test-6b4cdf4ccb-7pzt6在rancher-kf-worker01节点上,它的ip为10.42.3.23
3、先在pod所在的宿主机上然后在另外几个节点去ping这个ip,看看能否ping通,在canal网络模式下,请检查防火墙端口8472/UDP是否开放。查看每天机器上是否有尝试使用每台机器的flannel.1网卡,用的话,用flannel.1上的ip互相ping,看看是否能通,因为flannel网络和canal网络是通过flannel.1网卡互相建立vxlan遂道的。建议操作在关闭防火墙的情况下测试。
部署使用calico网络部署环境失败问题
部署rancher2.0时网络类型为calico时,如果cloud provider默认不填会选用公有云的,导致部署失败,所以这里我们需要手动填写为none。(后期会优化此项)
部署时主机not found问题
出现这个问题是因为宿主机的主机名不符合kubernetes的标准主机名要求也不符合标准的linux主机名,主机名内不能有下划线。
获取组件健康状态forbidden问题
大部分原因是因为部署多次,证书残留的导致的,解决办法,按照环境信息残留里面的方法把环境清空下,在重新添加。
web页面kubectl闪退问题
这个主要根操作系统版本和浏览器的版本有关系,请使用上推荐使用操作系统中的操作系统,浏览器使用Chrome
非worker节点仍然被调度pod问题
目前rancher2.0非worker节点,仍然会被调度pod过去,您可以选择手动将它们从kube-scheduler踢除,命令如下:
在获取节点在kubernetes集群的名字
打开web页面kubectl
然后执行
kubectl taint node rancher-kf-control01 node-role.kubernetes.io/rancher-kf-control01="":NoSchedule kubectl taint node rancher-kf-control02 node-role.kubernetes.io/rancher-kf-control02="":NoSchedule kubectl taint node rancher-kf-control03 node-role.kubernetes.io/rancher-kf-control03="":NoSchedule
it is a not share mount问题
部署时遇到share mount问题时,报错提示如下:
FATA[0180] [workerPlane] Failed to bring up Worker Plane: Failed to start [kubelet] container on host [192.168.10.51]: Error response from daemon: linux mounts: Path /var/lib/kubelet is mounted on / but it is not a shared mount.
这个问题原因主要是kubelet容器化部署,需要手动设置docker的MuntFLAGS为空
https://github.com/kubernetes/kubernetes/issues/4869#issuecomment-195696990
解决方法:
执行
mount --make-shared /
或配置docker.server
MountFlags=shared
重启docker.service
NetworkRedy=false问题
这个问题通常是,在部署时网络组件在初始化,在配置,等待段时间就好了。或在对应节点查看kubelet日志的docker logs kubelet。
集群unavailable
通常此问题,是因为rancher-server根kubernetes中的kube-apiserver 6443端口连接有问题,建议检查防火墙和查看kube-api-server的日志。
总结
1、部署时能严格按照官方给出的操作系统版本和docker版本部署,可以避免掉很多问题。
2、多次部署,升级,环境一定要按照环境信息残留章节的命令,将环境清理干净。
3、如果遇到问题,建议docker logs 查看rancher-agent,rancher-server的日志。
以上就是Rancher 2.0部署过程中常见问题分析与解决方法,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注创新互联行业资讯频道。
当前题目:Rancher2.0部署过程中常见问题分析与解决方法
文章地址:http://hbruida.cn/article/pggioo.html