k8s的HPA是什么

这篇文章将为大家详细讲解有关k8s的HPA是什么，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

站在用户的角度思考问题，与客户深入沟通，找到抚松网站设计与抚松网站推广的解决方案，凭借多年的经验，让设计与互联网技术结合，创造个性化、用户体验好的作品，建站类型包括：成都做网站、网站设计、企业官网、英文网站、手机端网站、网站推广、主机域名、网络空间、企业邮箱。业务覆盖抚松地区。

HPA介绍

Kubernetes HPA（水平Pod自动缩放）Pod水平自动伸缩，通过此功能，只需简单的配置，即可便可以利用监控指标（cpu使用率、磁盘、内存等）自动的扩容或缩容服务中Pod数量，当业务需求增加时，系统将为您无缝地自动增加适量容器，提高系统稳定性。此处将详细讲解HPA的核心设计原理和基于Hepaster的使用方法。

前提条件

系统应该能否获取到当前Pod的资源使用情况 (意思是可以执行kubectl top pod命令,并且能够得到反馈信息)。

若要实现自动扩缩容的功能，还需要部署heapster服务，用来收集及统计资源的利用率，支持kubectl top命令，heapster服务集成在prometheus（普罗米修斯） MertricServer服务中，所以说，为了方便，我这里基于prometheus服务的环境上进行部署HPA（动态扩缩容）的服务。

实验环境

主机	IP地址	服务
master	192.168.1.21	k8s
node01	192.168.1.22	k8s
node02	192.168.1.23	k8s

基于[https://blog.51cto.com/14320361/2473879]() 的实验继续进行

k8s的HPA是什么

heapster：这个组件之前是集成在k8s集群的,不过在1.12版本之后被移除了。如果还想使用此功能，应该部署metricServer, 这个k8s集群资源使用情况的聚合器。
Cousom：同样处于beta阶段(autoscaling/v2beta1)，但是涉及到自定义的REST API的开发，复杂度会大一些，并且当需要从自定义的监控中获取数据时，只能设置绝对值，无法设置使用率。

自动扩展主要分为两种：

水平扩展(scale out)，针对于实例数目的增减。
垂直扩展(scal up)，即单个实例可以使用的资源的增减, 比如增加cpu和增大内存。
HPA属于前者。它可以根据CPU使用率或应用自定义metrics自动扩展Pod数量(支持 replication controller、deployment 和 replica set)。

工作流程

创建HPA资源，设定目标CPU使用率限额，以及最大/最小实例数，一定要设置Pod的资源限制参数: request，否则HPA不会工作。
控制管理器每隔30s(在kube-controller-manager.service中可以通过–-horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况。
然后与创建时设定的值和指标做对比(平均值之和/限额)，求出目标调整的实例个数。
目标调整的实例数不能超过第一条中设定的最大/最小实例数。如果没有超过，则扩容；超过，则扩容至最大的实例个数。
重复第2-4步。

这里，我们使用一个测试镜像，这个镜像基于php-apache制作的docker镜像，包含了一些可以运行cpu密集计算任务的代码。

1、创建一个deployment控制器

[root@master ~]#docker pull mirrorgooglecontainers/hpa-example:latest
//下载hpa-example镜像

[root@master ~]# kubectl run php-apache --image=mirrorgooglecontainers/hpa-example --requests=cpu=200m --expose  --port=80
//基于hpa-example镜像，运行一个deployment控制器，请求CPU的资源为200m，暴露一个80端口

查看一下

[root@master ~]# kubectl get deployments.

k8s的HPA是什么

2、创建HPA控制器

[root@master ~]# kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
//当deployment资源对象的CPU使用率达到50%时，就进行扩容，最多可以扩容到10个

查看一下

[root@master ~]# kubectl get hpa

k8s的HPA是什么

3、测试（master开启三个端口）

新开启多个终端，对pod进行死循环请求php-apache的pod

端口一

（1）创建一个应用，用来不停的访问我们刚刚创建的php-apache的svc资源。

[root@master ~]# kubectl run -i --tty load-generator --image=busybox /bin/sh

（2）进入Pod内，执行以下这条命令.用来模拟访问php-apache的svc资源。

[root@master ~]# while true; do wget -q -O- http://php-apache.default.svc.cluster.local ; done
//不停地向php-apache的svc资源，发送ok

端口二

[root@master ~]# kubectl get hpa -w
//实时查看pod的cpu状态

k8s的HPA是什么

可以看到php-apache的cpu使用情况已经超过了50%

端口三

[root@master images]# kubectl get pod -w
//实时查看pod的状态

k8s的HPA是什么

关于“k8s的HPA是什么”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

分享名称：k8s的HPA是什么
网站URL：http://hbruida.cn/article/gjdejh.html

k8s的HPA是什么

HPA介绍

前提条件

实验环境

自动扩展主要分为两种：

工作流程

1、创建一个deployment控制器

查看一下

2、创建HPA控制器

查看一下

3、测试（master开启三个端口）

端口一

（1）创建一个应用，用来不停的访问我们刚刚创建的php-apache的svc资源。

（2）进入Pod内，执行以下这条命令.用来模拟访问php-apache的svc资源。

端口二

端口三

其他资讯