檢視多核 CPU 命令
mpstat -P ALL 和 sar -P ALL
説明:sar -P ALL > aaa.txt 重定向輸出內容到檔案 aaa.txt
top 命令
經常用來監控 linux 的系統狀況,比如 cpu 、內存的使用,程式設計師基本都知道這個命令,但比較奇怪的是能用好它的人卻很少,例如 top 監控檢視中內存數值的含義就有不少的曲解。
本文通過一個執行中的 WEB 站羣服務器的 top 監控截圖,講述 top 檢視中的各種資料的含義,還包括檢視中各程序(任務)的欄位的排序。
top 進入檢視
第一行:
10:08:45 — 當前系統時間
10 days, 3:05 — 系統已經執行了 10 天 3 小時 5 分鐘(在這期間沒有重啓過)
1 users — 當前有 1 個使用者登入系統
load average: 0.00, 0.00, 0.00 — load average 後面的三個數分別是 1 分鐘、 5 分鐘、 15 分鐘的負載情況。
load average 資料是每隔 5 秒鐘檢查一次活躍的程序數,然後按特定演算法計算出的數值。如果這個數除以邏輯 CPU 的數量,結果高於 5 的時候就表明系統在超負荷運轉了。
第二行:
Tasks — 任務(程序),系統現在共有 135 個程序,其中處於執行中的有 1 個,134 個在休眠(sleep),stoped 狀態的有 0 個,zombie 狀態(殭屍)的有 0 個。
第三行:cpu 狀態
0.3% us — 使用者空間佔用 CPU 的百分比。
0.0% sy — 核心空間佔用 CPU 的百分比。
0.0% ni — 改變過優先順序的程序佔用 CPU 的百分比
99.7% id — 空閒 CPU 百分比
0.0% wa — IO 等待佔用 CPU 的百分比
0.0% hi — 硬中斷(Hardware IRQ)佔用 CPU 的百分比
0.0% si — 軟中斷(Software Interrupts)佔用 CPU 的百分比
在這裏 CPU 的使用比率和 windows 概念不同,如果你不理解使用者空間和核心空間,需要充充電了。
第四行:內存狀態
3808060k total — 實體內存總量(4GB)
3660048k used — 使用中的內存總量(3.6GB)
148012k free — 空閒內存總量(148M)
359760k buffers — WordPress 加速緩存的內存量 (359M)
第五行:swap 交換分割槽
4184924k total — 交換區總量(4G)
0k used — 使用的交換區總量(0M)
4184924k free — 空閒交換區總量(4G)
2483956k cached — 緩衝的交換區總量(2483M)
第四行中使用中的內存總量(used)指的是現在系統核心控制的內存數,空閒內存總量(free)是核心還未納入其管控範圍的數量。納入核心管理的內存不見得都在使用中,還包括過去使用過的現在可以被重複利用的內存,核心並不把這些可被重新使用的內存交還到 free 中去,因此在 linux 上 free 內存會越來越少,但不用為此擔心。
如果出於習慣去計算可用內存數,這裏有個近似的計算公式:第四行的 free + 第四行的 buffers + 第五行的 cached,按這個公式此台站羣服務器的可用內存:148M+259M+2483M = 2990M 。
對於內存監控,在 top 裏我們要時刻監控第五行 swap 交換分割槽的 used,如果這個數值在不斷的變化,説明核心在不斷進行內存和 swap 的資料交換,這是真正的內存不夠用了。
第六行是空行
第七行以下:各程序(任務)的狀態監控
PID — 程序 id
USER — 程序所有者
PR — 程序優先順序
NI — nice 值。負值表示高優先順序,正值表示低優先順序
VIRT — 程序使用的虛擬內存總量,單位 kb 。 VIRT=SWAP+RES
RES — 程序使用的、未被換出的實體內存大小,單位 kb 。 RES=CODE+DATA
SHR — 共享內存大小,單位 kb
S — 程序狀態。 D=不可中斷的睡眠狀態 R=執行 S=睡眠 T=跟蹤/停止 Z=殭屍程序
%CPU — 上次更新到現在的 CPU 時間佔用百分比
%MEM — 程序使用的實體內存百分比
TIME+ — 程序使用的 CPU 時間總計,單位 1/100 秒
COMMAND — 程序名稱(命令名/命令列)
多 U 多核 CPU 監控
在 top 基本檢視中,按鍵盤數字 “1”,可監控每個邏輯 CPU 的狀況:
觀察上圖,站羣服務器有 4 個邏輯 CPU,實際上是 1 個物理 CPU 。
如果不按 1,則在 top 檢視裏面顯示的是所有 cpu 的平均值。
程序欄位排序
預設進入 top 時,各程序是按照 CPU 的佔用量來排序的,在【top 檢視 01】中程序 ID 為 14210 的 java 程序排在第一(cpu 佔用 100%),程序 ID 為 14183 的 java 程序排在第二(cpu 佔用 12%)。可通過鍵盤指令來改變排序欄位,比如想監控哪個程序佔用 MEM 最多,我一般的使用方法如下:
1. 敲擊鍵盤 “b”(開啓/關閉加亮效果),top 的檢視變化如下:
我們發現程序 id 為 12363 的 “top” 程序被加亮了,top 程序就是檢視第二行顯示的唯一的執行態(runing)的那個程序,可以通過敲擊 “y” 鍵關閉或開啓執行態程序的加亮效果。
2. 敲擊鍵盤 “x”(開啓/關閉排序列的加亮效果),top 的檢視變化如下:
可以看到,top 預設的排序列是 “%CPU” 。
3. 通過”shift + >” 或”shift + <”可以向右或左改變排序列,下圖是按一次”shift + >” 的效果圖:
檢視現在已經按照%MEM 來排序了。
改變程序顯示欄位
1. 敲擊 “f” 鍵,top 進入另一個檢視,在這裏可以編排基本檢視中的顯示欄位:
這裏列出了所有可在 top 基本檢視中顯示的程序欄位,有”*” 並且標註為大寫字母的欄位是可顯示的,沒有”*” 並且是小寫字母的欄位是不顯示的。如果要在基本檢視中顯示 “CODE” 和 “DATA” 兩個欄位,可以通過敲擊 “r” 和 “s” 鍵:
2. “回車” 返回基本檢視,可以看到多了 “CODE” 和 “DATA” 兩個欄位:
top 命令的補充
top 命令是 Linux 上進行系統監控的首選命令,但有時候卻達不到我們的要求,比如當前這台站羣服務器,top 監控有很大的侷限性。這台站羣服務器執行著 websphere 叢集,有兩個節點服務,就是【top 檢視 01】中的老大、老二兩個 java 程序,top 命令的監控最小單位是程序,所以看不到我關心的 java 執行緒數和客户連線數,而這兩個指標是 java 的 web 服務非常重要的指標,通常我用 ps 和 netstate 兩個命令來補充 top 的不足。
監控 java 執行緒數:
ps -eLf | grep java | wc -l
監控互聯網客户連線數:
netstat -n | grep tcp | grep 偵聽埠 | wc -l
上面兩個命令,可改動 grep 的引數,來達到更細緻的監控要求。
在 Linux 系統 “一切都是檔案” 的思想貫徹指導下,所有程序的執行狀態都可以用檔案來獲取。系統根目錄/proc 中,每一個數字子目錄的名字都是執行中的程序的 PID,進入任一個程序目錄,可通過其中檔案或目錄來觀察程序的各項執行指標,例如 task 目錄就是用來描述程序中執行緒的,因此也可以通過下面的方法獲取某程序中執行中的執行緒數量(PID 指的是程序 ID):
ls /proc/PID/task | wc -l
在 linux 中還有一個命令 pmap,來輸出程序內存的狀況,可以用來分析執行緒堆疊:
pmap PID
大家都熟悉 Linux 下可以通過 top 命令來檢視所有程序的內存,CPU 等資訊。除此之外,還有其他一些命令,可以得到更詳細的資訊,例如程序相關
cat /proc/your_PID/status
通過 top 或 ps -ef | grep ‘程序名’ 得到程序的 PID 。該命令可以提供程序狀態、檔案控制代碼數、內存使用情況等資訊。
內存相關
vmstat -s -S M
該可以檢視包含內存每個專案的報告,通過-S M 或-S k 可以指定檢視的單位,預設為 kb 。結合 watch 命令就可以看到動態變化的報告了。
也可用 cat /proc/meminfo
要看 cpu 的配置資訊可用
cat /proc/cpuinfo
它能顯示諸如 CPU 核心數,時脈頻率、 CPU 型號等資訊。
要檢視 cpu 波動情況的,尤其是多核機器上,可使用
mpstat -P ALL 10
該命令可間隔 10 秒鐘取樣一次 CPU 的使用情況,每個核的情況都會顯示出來,例如,每個核的 idle 情況等。
只需檢視均值的,可用
iostat -c
IO 相關
iostat -P ALL
該命令可檢視所有裝置使用率、讀寫位元組數等資訊。
另外,htop ,有時間可以用一下。
Linux 檢視物理 CPU 個數、核數、邏輯 CPU 個數
# 總核數 = 物理 CPU 個數 X 每顆物理 CPU 的核數
# 總邏輯 CPU 數 = 物理 CPU 個數 X 每顆物理 CPU 的核數 X 超執行緒數
# 檢視物理 CPU 個數
cat /proc/cpuinfo| grep “physical id”| sort| uniq| wc -l
# 檢視每個物理 CPU 中 core 的個數 (即核數)
cat /proc/cpuinfo| grep “cpu cores”| uniq
# 檢視邏輯 CPU 的個數
cat /proc/cpuinfo| grep “processor”| wc -l
檢視 CPU 資訊(型號)
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c