一、什么是系統(tǒng)平均負(fù)載(Load average)?
在Linux系統(tǒng)中,uptime、w、top等命令都會(huì)有系統(tǒng)平均負(fù)載load average的輸出,那么什么是系統(tǒng)平均負(fù)載呢?
系統(tǒng)平均負(fù)載被定義為在特定時(shí)間間隔內(nèi)運(yùn)行隊(duì)列中的平均進(jìn)程樹。如果一個(gè)進(jìn)程滿足以下條件則其就會(huì)位于運(yùn)行隊(duì)列中:
- 它沒有在等待I/O操作的結(jié)果
- 它沒有主動(dòng)進(jìn)入等待狀態(tài)(也就是沒有調(diào)用'wait')
- 沒有被停止(例如:等待終止)
例如:
[root@opendigest root]# uptime
7:51pm up 2 days, 5:43, 2 users, load average: 8.13, 5.90, 4.94
命令輸出的最后內(nèi)容表示在過去的1、5、15分鐘內(nèi)運(yùn)行隊(duì)列中的平均進(jìn)程數(shù)量。
一般來說只要每個(gè)CPU的當(dāng)前活動(dòng)進(jìn)程數(shù)不大于3那么系統(tǒng)的性能就是良好的,如果每個(gè)CPU的任務(wù)數(shù)大于5,那么就表示這臺(tái)機(jī)器的性能有嚴(yán)重問題。對于上面的例子來說,假設(shè)系統(tǒng)有兩個(gè)CPU,那么其每個(gè)CPU的當(dāng)前任務(wù)數(shù)為:8.13/2=4.065。這表示該系統(tǒng)的性能是可以接受的。
二、Load average的算法
上面的輸出數(shù)據(jù)是每隔5秒鐘檢查一次活躍的進(jìn)程數(shù),然后根據(jù)這個(gè)數(shù)值算出來的。如果這個(gè)數(shù)除以CPU的數(shù)目,結(jié)果高于5的時(shí)候就表明系統(tǒng)在超負(fù)荷運(yùn)轉(zhuǎn)了。其算法(摘自Linux 2.4的內(nèi)核代碼)如下:
文件: include/linux/sched.h:
#define FSHIFT 11 /* nr of bits of precision */
#define FIXED_1 (1#define LOAD_FREQ (5*HZ) /* 5 sec intervals */
#define EXP_1 1884 /* 1/exp(5sec/1min) as fixed-point, 2048/pow(exp(1), 5.0/60) */
#define EXP_5 2014 /* 1/exp(5sec/5min), 2048/pow(exp(1), 5.0/300) */
#define EXP_15 2037 /* 1/exp(5sec/15min), 2048/pow(exp(1), 5.0/900) */
#define CALC_LOAD(load,exp,n) \
load *= exp; \
load += n*(FIXED_1-exp); \
load >>= FSHIFT;
文件: kernel/timer.c:
unsigned long avenrun[3];
static inline void calc_load(unsigned long ticks)
{
unsigned long active_tasks; /* fixed-point */
static int count = LOAD_FREQ;
count -= ticks;
if (count 0) {
count += LOAD_FREQ;
active_tasks = count_active_tasks();
CALC_LOAD(avenrun[0], EXP_1, active_tasks);
CALC_LOAD(avenrun[1], EXP_5, active_tasks);
CALC_LOAD(avenrun[2], EXP_15, active_tasks);
}
}
文件: fs/proc/proc_misc.c:
#define LOAD_INT(x) ((x) >> FSHIFT)
#define LOAD_FRAC(x) LOAD_INT(((x) (FIXED_1-1)) * 100)
static int loadavg_read_proc(char *page, char **start, off_t off,
int count, int *eof, void *data)
{
int a, b, c;
int len;
a = avenrun[0] + (FIXED_1/200);
b = avenrun[1] + (FIXED_1/200);
c = avenrun[2] + (FIXED_1/200);
len = sprintf(page,"%d.%02d %d.%02d %d.%02d %ld/%d %d\n",
LOAD_INT(a), LOAD_FRAC(a),
LOAD_INT(b), LOAD_FRAC(b),
LOAD_INT(c), LOAD_FRAC(c),
nr_running(), nr_threads, last_pid);
return proc_calc_metrics(page, start, off, count, eof, len);
}
三、/proc/loadavg 各項(xiàng)數(shù)據(jù)的含義
/proc文件系統(tǒng)是一個(gè)虛擬的文件系統(tǒng),不占用磁盤空間,它反映了當(dāng)前操作系統(tǒng)在內(nèi)存中的運(yùn)行情況,查看/proc下的文件可以聊寄到系統(tǒng)的運(yùn)行狀態(tài)。查看系統(tǒng)平均負(fù)載使用“cat /proc/loadavg”命令,輸出結(jié)果如下:
0.27 0.36 0.37 4/83 4828/
前三個(gè)數(shù)字大家都知道,是1、5、15分鐘內(nèi)的平均進(jìn)程數(shù)(有人認(rèn)為是系統(tǒng)負(fù)荷的百分比,其實(shí)不然,有些時(shí)候可以看到200甚至更多)。后面兩個(gè)呢,一個(gè)的分子是正在運(yùn)行的進(jìn)程數(shù),分母是進(jìn)程總數(shù);另一個(gè)是最近運(yùn)行的進(jìn)程ID號。
四、查看系統(tǒng)平均負(fù)載的常用命令
1、
cat /proc/loadavg
2、uptime
名稱: uptime
使用權(quán)限: 所有使用者
使用方式: uptime [-V]
說明: uptime 提供使用者下面的資訊,不需其他參數(shù):
現(xiàn)在的時(shí)間 系統(tǒng)開機(jī)運(yùn)轉(zhuǎn)到現(xiàn)在經(jīng)過的時(shí)間 連線的使用者數(shù)量 最近一分鐘,五分鐘和十五分鐘的系統(tǒng)負(fù)載
參數(shù): -V 顯示版本資訊。
范例: uptime
其結(jié)果為:
10:41am up 5 days, 10 min, 1 users, load average: 0.00, 0.00, 1.99
3、w
功能說明:顯示目前登入系統(tǒng)的用戶信息。
語 法:w [-fhlsuV][用戶名稱]
補(bǔ)充說明:執(zhí)行這項(xiàng)指令可得知目前登入系統(tǒng)的用戶有那些人,以及他們正在執(zhí)行的程序。單獨(dú)執(zhí)行w
指令會(huì)顯示所有的用戶,您也可指定用戶名稱,僅顯示某位用戶的相關(guān)信息。
參 數(shù):
-f 開啟或關(guān)閉顯示用戶從何處登入系統(tǒng)。
-h 不顯示各欄位的標(biāo)題信息列。
-l 使用詳細(xì)格式列表,此為預(yù)設(shè)值。
-s 使用簡潔格式列表,不顯示用戶登入時(shí)間,終端機(jī)階段作業(yè)和程序所耗費(fèi)的CPU時(shí)間。
-u 忽略執(zhí)行程序的名稱,以及該程序耗費(fèi)CPU時(shí)間的信息。
-V 顯示版本信息。
4、top
功能說明:顯示,管理執(zhí)行中的程序。
語 法:top [bciqsS][d 間隔秒數(shù)>][n 執(zhí)行次數(shù)>]
補(bǔ)充說明:執(zhí)行top指令可顯示目前正在系統(tǒng)中執(zhí)行的程序,并通過它所提供的互動(dòng)式界面,用熱鍵加以管理。
參 數(shù):
b 使用批處理模式。
c 列出程序時(shí),顯示每個(gè)程序的完整指令,包括指令名稱,路徑和參數(shù)等相關(guān)信息。
d間隔秒數(shù)> 設(shè)置top監(jiān)控程序執(zhí)行狀況的間隔時(shí)間,單位以秒計(jì)算。
i 執(zhí)行top指令時(shí),忽略閑置或是已成為Zombie的程序。
n執(zhí)行次數(shù)> 設(shè)置監(jiān)控信息的更新次數(shù)。
q 持續(xù)監(jiān)控程序執(zhí)行的狀況。
s 使用保密模式,消除互動(dòng)模式下的潛在危機(jī)。
S 使用累計(jì)模式,其效果類似ps指令的"-S"參數(shù)。
5、tload
功能說明:顯示系統(tǒng)負(fù)載狀況。
語 法:tload [-V][-d 間隔秒數(shù)>][-s 刻度大小>][終端機(jī)編號]
補(bǔ)充說明:tload指令使用ASCII字符簡單地以文字模式顯示系統(tǒng)負(fù)載狀態(tài)。假設(shè)不給予終端機(jī)編號,則會(huì)在執(zhí)行tload指令的終端機(jī)顯示負(fù)載情形。
參 數(shù):
-d間隔秒數(shù)> 設(shè)置tload檢測系統(tǒng)負(fù)載的間隔時(shí)間,單位以秒計(jì)算。
-s刻度大小> 設(shè)置圖表的垂直刻度大小,單位以列計(jì)算。
-V 顯示版本信息。
四、系統(tǒng)平均負(fù)載-進(jìn)階解釋
為了更好地理解系統(tǒng)負(fù)載,我們用交通流量來做類比。
1、單核CPU - 單車道 - 數(shù)字在0.00-1.00之間正常
路況管理員會(huì)告知司機(jī),如果前面比較擁堵,那司機(jī)就要等待,如果前面一路暢通,那么司機(jī)就可以駕車直接開過。
具體來說:
0.00-1.00 之間的數(shù)字表示此時(shí)路況非常良好,沒有擁堵,車輛可以毫無阻礙地通過。
1.00 表示道路還算正常,但有可能會(huì)惡化并造成擁堵。此時(shí)系統(tǒng)已經(jīng)沒有多余的資源了,管理員需要進(jìn)行優(yōu)化。
1.00-*** 表示路況不太好了,如果到達(dá)2.00表示有橋上車輛一倍數(shù)目的車輛正在等待。這種情況你必須進(jìn)行檢查了。
2、多核CPU - 多車道 - 數(shù)字/CPU核數(shù) 在0.00-1.00之間正常
多核CPU的話,滿負(fù)荷狀態(tài)的數(shù)字為 "1.00 * CPU核數(shù)",即雙核CPU為2.00,四核CPU為4.00。
3、安全的系統(tǒng)平均負(fù)載
作者認(rèn)為單核負(fù)載在0.7以下是安全的,超過0.7就需要進(jìn)行優(yōu)化了。
4、應(yīng)該看哪一個(gè)數(shù)字,1分鐘,5分鐘還是15分鐘?
作者認(rèn)為看5分鐘和15分鐘的比較好,即后面2個(gè)數(shù)字。
5、怎樣知道我的CPU是幾核呢?
使用以下命令可以直接獲得CPU核心數(shù)目
grep 'model name' /proc/cpuinfo | wc -l
結(jié)論
取得CPU核心數(shù)目N,觀察后面2個(gè)數(shù)字,用數(shù)字/N,如果得到的值小于0.7即可無憂。