转帖－－ Docker 监控的一点想法

daowanlilai · 2015-10-27 02:45:39 UTC

目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。

关于监控的内容

监控宿主机本身

监控宿主机本身还是比较简单的，同其他服务器监控类似，对 cpu、network、io、disk 等做通用的检查，这里不再细说。

额外的，因为是 docker 的宿主机，还应该监控容器本身的一些指标，如：

拥有的全部的容器数量；
正在运行的容器的数量；
dead 容器的数量（如果此数量变化应该报警）；
docker 本身的信息，如 Storage Driver、Data Space Used、Data Space Total、Metadata Space Total、Metadata Space Used、client version、client api version、server version、servier api version 等；

###监控容器

docker 容器通过 namespace 做资源隔离，通过 cgroup 来做资源限制。监控方便，只能通过在宿主机本身查看对应容器的 cgroup stats。

具体大项有：

容器的本身信息，如名称，ip、使用的镜像、启动时间、启动命令等；
容器的状态，如可先监控两个量值，running or not running （当状态变化时报警）；
容器使用 cpu 的资源信息；
容器使用 memory 的资源信息；
容器的 network io 信息；
容器的 disk 信息；

关于监控项的获取

宿主机本身

拥有的全部容器的数量：

docker ps -a -q | wc -l

正在运行的容器的数量：

docker ps  -q | wc -l

非运行状态的容器的数量：

docker ps -a  | grep -v 'Up '  | grep -v 'CONTAINER' | wc -l

docker 本身信息，可从命令 docker version & docker info 中获取

监控容器

1、容器本身信息 & 状态：

从 docker inspect 中获取，简单脚本如下：

#!/usr/bin/env python
import commands
import sys
import types
import json
def get_container_info( container ):
msg = commands.getoutput('docker inspect '+container)
#return msg
data = json.loads( msg )
return data[0]
container = sys.argv[1]
msg = get_container_info( container )
containerid = msg["Id"]
image = msg['Image']
name = msg['Name']
ip = msg['NetworkSettings']['IPAddress']
status = msg['State']['Running']
startedat = msg['State']['StartedAt']
print containerid, image, name, ip, status, startedat

2、容器使用 cpu 情况：

从 cpuacct 中获取相应的值，首先要获取一个 cpu 周期的时间值，getconf CLK_TCK，默认为100，即100Hz，一个周期即为 1/100s = 10ms = 10^7 ns；

可以获取 cpuacct.usage、 cpuacct.stat ，但是具体怎么做对比，还得观察。

理论上的计算方法为，在单位时间内，docker 容器对应的 cpu 使用的变化值除以总系统 cpu 时间的变化值乘以 100%；其中，docker 容器对应的 cpu 值可以从 cgroup.cpuacct 中的 cpuacct.usage 值得到，他的单位是纳秒，10^9 个纳秒为1秒；系统的 cpu 总时间可以从 /proc/stat 中获取，第一行中。以 “cpu” 开头那行，数值累加就是当前系统 cpu 总时间，需要注意的是，他的数值单位为 “cpu 周期”，就是刚才获取到的 1/CLK_TCK ，关于 /proc/stat 的说明文档：http://www.linuxhowtos.org/System/procstat.htm

从 docker 源码中获知，docker 的 stats 计算方法和这个有点出入，它在此计算的基础上，又乘以 cpu 核数得到最终结果，这个让我有点不理解，和官方确认中。。。。。
已经和官方确认，只是双方对 “cpu 利用率如何定义” 的问题，我认为应该是平均利用率，官方认为应该是 total cpu 利用率，好吧。。。。。地址为： #issues 13626
相关源码地址为：https://github.com/docker/docker/blob/0d445685b8d628a938790e50517f3fb9…

以下是用 shell 完成的模拟 docker 计算 cpu 利用率方法的小脚本：

#!/bin/sh
##echo user nice system idle iowait irq softirq
CPULOG_1=$(cat /proc/stat | grep 'cpu ' | awk '{print $2" "$3" "$4" "$5" "$6" "$7" "$8}')
Total_1=$(echo $CPULOG_1 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
CGROUP_USAGE_1=$(cat /cgroup/cpuacct/docker/55dec85d2e93c487fbeb1e85c9677e64dd1b4bdcc5be0e5f2539e52c87641d4e/cpuacct.usage)
sleep 1
CPULOG_2=$(cat /proc/stat | grep 'cpu ' | awk '{print $2" "$3" "$4" "$5" "$6" "$7" "$8}')
Total_2=$(echo $CPULOG_2 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
CGROUP_USAGE_2=$(cat /cgroup/cpuacct/docker/55dec85d2e93c487fbeb1e85c9677e64dd1b4bdcc5be0e5f2539e52c87641d4e/cpuacct.usage)
CGROUP_USAGE=`expr $CGROUP_USAGE_2 - $CGROUP_USAGE_1`
Total=`expr $Total_2 - $Total_1`
CGROUP_RATE=`expr $CGROUP_USAGE*24/$Total/10000000*100|bc -l`
echo $CGROUP_USAGE_1 , $CGROUP_USAGE_2 , $CGROUP_USAGE , $Total,  $CGROUP_RATE

3、容器使用 memory 情况：

从容器所在 cgroup 组中查看 memory.stats 信息，具体值的信息如下

统计描述
cache 页缓存，包括 tmpfs（shmem），单位为字节
Rss 匿名和 swap 缓存，不包括 tmpfs（shmem），单位为字节
Mapped_file memory-mapped 映射的文件大小，包括 tmpfs（shmem），单位为字节
pgpgin 存入内存中的页数
pgpgout 从内存中读出的页数
swap swap 用量，单位为字节
Active_anon 在活跃的最近最少使用（least-recently-used，LRU）列表中的匿名和 swap 缓存，包括 tmpfs（shmem），单位为字节
Inactive_anon 不活跃的 LRU 列表中的匿名和 swap 缓存，包括tmpfs（shmem），单位为字节
Active_file 活跃 LRU 列表中的 file-backed 内存，以字节为单位
Inactive_file 不活跃 LRU 列表中的 file-backed 内存，以字节为单位
unevictable 无法再生的内存，以字节为单位
hierarchical_memory_limit（重点）包含 memory cgroup 的层级的内存限制，单位为字节
hierarchical_memsw_limit 包含 memory cgroup 的层级的内存加 swap 限制，单位为字节

4、容器网络 io 情况：可以执行命令： docker exec ifconfig eth0 看 Rx 和 Tx 的值。

5、磁盘 io 情况从 blkio 中获取，相关参考：

blkio.time：统计cgroup对设备的访问时间，按格式device_types:node_numbers milliseconds读取信息即可，以下类似。
blkio.io_serviced：统计cgroup对特定设备的IO操作（包括read、write、sync及async）次数，格式device_types:node_numbers operation number
blkio.sectors：统计cgroup对设备扇区访问次数，格式device_types:node_numbers sector_count
blkio.io_service_bytes：统计cgroup对特定设备IO操作（包括read、write、sync及async）的数据量，格式device_types:node_numbers operation bytes
blkio.io_queued：统计cgroup的队列中对IO操作（包括read、write、sync及async）的请求次数，格式number operation
blkio.io_service_time：统计cgroup对特定设备的IO操作（包括read、write、sync及async）时间(单位为ns)，格式device_types:node_numbers operation time
blkio.io_merged：统计cgroup 将 BIOS 请求合并到IO操作（包括read、write、sync及async）请求的次数，格式number operation
blkio.io_wait_time：统计cgroup在各设备中各类型IO操作（包括read、write、sync及async）在队列中的等待时间(单位ns)，格式device_types:node_numbers operation time

6、磁盘使用情况，我以为只需要监控 docker pool space 的状况即可，默认建立100G 的空间供 docker 使用，可通过 docker info 来查看，一个典型的输出如下：

Containers: 11
Images: 181
Storage Driver: devicemapper
Pool Name: docker-8:5-7471107-pool
Pool Blocksize: 65.54 kB
Backing Filesystem: extfs
Data file:
Metadata file:
Data Space Used: 7.846 GB
Data Space Total: 107.4 GB
Metadata Space Used: 15.92 MB
Metadata Space Total: 2.147 GB
Udev Sync Supported: true
Library Version: 1.02.89-RHEL6 (2014-09-01)
Execution Driver: native-0.2
Kernel Version: 2.6.32-431.el6.x86_64
Operating System:
CPUs: 24
Total Memory: 62.87 GiB
Name: jx-lj-opweb01.lianjia.com
ID: QTML:RSSS:IKAX:FRIP:4YEQ:IXWX:ROMV:APZD:RV4M:ISY2:QW2D:VMXW

7、在前期可以先重点监控宿主机情况 & 容器的 memory 状态，其他状态可记录，监控值可稍后商榷。

注：本文转自由刘阳龙Herman 创作的 Docker 监控的一点想法。

AODfalse · 2015-10-26 03:35:36 UTC

很好很强大很有用