比较详细介绍的文章
理解Linux系统负荷
如何查看
top - 09:55:36 up 135 days, 21:53, 1 user, load average: 0.75, 1.31, 1.39
09:55:24 up 135 days, 21:53, 1 user, load average: 0.58, 1.31, 1.39
09:55:05 up 135 days, 21:52, 1 user, load average: 0.62, 1.37, 1.41
1.92 1.43 1.41 1/575 29081
含义和解释
- 分别表示系统在过去1分钟、5分钟、15分钟内运行进程队列中的平均进程数量
- 单核CPU - 单车道 - 数字在0.00-1.00之间正常
- 多核CPU - 多车道 - 数字/CPU核数 在0.00-1.00之间正常
- 多核CPU的话,满负荷状态的数字为 "1.00 * CPU核数",即双核CPU为2.00,四核CPU为4.00
- 多处理器
- 2个CPU表明系统负荷可以达到2.0,此时每个CPU都达到100%的工作量。推广开来,n个CPU的电脑,可接受的系统负荷最大为n.0。
- 安全的系统平均负载
- 单核负载在0.7以下是安全的,超过0.7就需要进行优化了。
- 应该看哪一个数字,1分钟,5分钟还是15分钟?
- 怎样知道我的CPU是几核呢?
grep 'model name' /proc/cpuinfo | wc -l
系统负荷的经验法则
- 1.0是系统负荷的理想值吗?
- 不一定,系统管理员往往会留一点余地,当这个值达到0.7,就应当引起注意了。经验法则是这样的:
- 当系统负荷持续大于0.7,你必须开始调查了,问题出在哪里,防止情况恶化。
- 当系统负荷持续大于1.0,你必须动手寻找解决办法,把这个值降下来。
- 当系统负荷达到5.0,就表明你的系统有很严重的问题,长时间没有响应,或者接近死机了。你不应该让系统达到这个值。