09-进程监控和维护命令
本章节下载: 09-进程监控和维护命令 (255.72 KB)
目 录
1.1.1 display exception context
1.1.2 display exception filepath
1.1.4 display kernel deadloop configuration
1.1.5 display kernel exception
1.1.7 display kernel starvation
1.1.8 display kernel starvation configuration
1.1.13 display process memory heap
1.1.14 display process memory heap address
1.1.15 display process memory heap size
1.1.17 monitor kernel deadloop enable
1.1.18 monitor kernel deadloop exclude-thread
1.1.19 monitor kernel deadloop time
1.1.20 monitor kernel starvation enable
1.1.21 monitor kernel starvation exclude-thread
1.1.22 monitor kernel starvation time
1.1.26 reset exception context
1.1.30 reset kernel starvation
display memory、display process、display process cpu、monitor process和monitor thread命令既可显示用户态进程的相关信息,又可显示内核线程的相关信息,为简便起见,在这些命令中,统一使用“进程”一词来指代。
display exception context命令用来显示进程异常时的上下文信息。
display exception context [ count value ] [ slot slot-number [ cpu cpu-number ] ]
count value:表示上下文信息的显示个数,取值范围为1~20,缺省值为1。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
当进程发生一次异常,系统会生成一个core文件,还会生成一条上下文信息,用于记录异常进程的ID、生成core文件的时间、core文件存放的位置、栈信息和寄存器信息。一个core文件对应1条上下文信息,最多记录的上下文信息数和可记录的core文件数目相同。
# 显示在设备上的异常上下文信息。
<Sysname> display exception context
------------------------------
Crash time: Tue Apr 9 17:14:30 2013
flash:/core/node0_routed_120_7_20130409-171430_1365527670.core
eax:0xfffffffc ebx:0x00000003 ecx:0xbfe244ec edx:0x0000000a
esp:0xbfe244b8 ebp:0xbfe244c8 esi:0xffffffff edi:0xbfe24674
eip:0xb7caba4a eflag:0x00000292 cs:0x00000073 ss:0x0000007b
ds:0x0000007b es:0x0000007b fs:0x00000000 gs:0x00000033
表1-1 display exception context命令输出信息描述表
生成core文件的进程ID |
|
导致生成core文件的信号 |
|
生成core文件的时间 |
|
core文件存放的位置 |
|
表1-2 生成core信号描述表
超过CPU限制(setrlimit) |
|
display exception filepath命令用来显示core文件的保存路径。
display exception filepath [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示设备在IRF中的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示设备core文件的保存路径。
<Sysname> display exception filepath
The exception filepath on slot 1 is flash:.
display kernel deadloop命令用来显示内核线程死循环信息。
display kernel deadloop show-number [ offset ] [ verbose ] [ slot slot-number [ cpu cpu-number ] ]
show-number:需要显示的死循环信息的数目,取值范围为1~20。
offset:需要显示的起始条目距最近条目的偏移,取值范围为0~19,缺省值为0。
verbose:表示显示详细信息。不指定该参数时,显示概要信息。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示最近一条内核线程死循环的概要信息。
<Sysname> display kernel deadloop 1
----------------- Deadloop record 1 -----------------
Description : BUG: soft lockup - CPU#0 stuck for 61! [comsh: 16306]
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Instruction address : 0x4004158c
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
# 显示最近一条内核线程死循环的详细信息。
<Sysname> display kernel deadloop 1 verbose
----------------- Deadloop record 1 -----------------
Description : BUG: soft lockup - CPU#0 stuck for 61! [comsh: 16306]
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Instruction address : 0x4004158c
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
Last 5 thread switches : migration/0 (11:16:00.823018)-->
swapper (11:16:00.833018)-->
kthreadd (11:16:00.833518)-->
swapper (11:16:00.833550)-->
disk (11:16:00.833560)
Register content:
Reg: r0, Val = 0x00000000 ; Reg: r1, Val = 0xe2be5ea0 ;
Reg: r2, Val = 0x00000000 ; Reg: r3, Val = 0x77777777 ;
Reg: r4, Val = 0x00000000 ; Reg: r5, Val = 0x00001492 ;
Reg: r6, Val = 0x00000000 ; Reg: r7, Val = 0x0000ffff ;
Reg: r8, Val = 0x77777777 ; Reg: r9, Val = 0x00000000 ;
Reg: r10, Val = 0x00000001 ; Reg: r11, Val = 0x0000002c ;
Reg: r12, Val = 0x057d9484 ; Reg: r13, Val = 0x00000000 ;
Reg: r14, Val = 0x00000000 ; Reg: r15, Val = 0x02000000 ;
Reg: r16, Val = 0xe2be5f00 ; Reg: r17, Val = 0x00000000 ;
Reg: r18, Val = 0x00000000 ; Reg: r19, Val = 0x00000000 ;
Reg: r20, Val = 0x024c10f8 ; Reg: r21, Val = 0x057d9244 ;
Reg: r22, Val = 0x00002000 ; Reg: r23, Val = 0x0000002c ;
Reg: r24, Val = 0x00000002 ; Reg: r25, Val = 0x24000024 ;
Reg: r26, Val = 0x00000000 ; Reg: r27, Val = 0x057d9484 ;
Reg: r28, Val = 0x0000002c ; Reg: r29, Val = 0x00000000 ;
Reg: r30, Val = 0x0000002c ; Reg: r31, Val = 0x00000000 ;
Reg: cr, Val = 0x84000028 ; Reg: nip, Val = 0x057d9550 ;
Reg: xer, Val = 0x00000000 ; Reg: lr, Val = 0x0186eff0 ;
Reg: ctr, Val = 0x682f7344 ; Reg: msr, Val = 0x00784b5c ;
Reg: trap, Val = 0x0000b030 ; Reg: dar, Val = 0x77777777 ;
Reg: dsisr, Val = 0x40000000 ; Reg: result, Val = 0x00020300 ;
Dump stack (total 1024 bytes, 16 bytes/line):
0xe2be5ea0: 02 be 5e c0 24 00 00 24 00 00 00 00 05 7d 94 84
0xe2be5eb0: 00 00 00 04 00 00 00 00 00 00 00 28 05 8d 34 c4
0xe2be5ec0: 02 be 60 a0 01 86 ef f0 00 00 00 00 00 00 00 00
0xe2be5ed0: 02 04 05 b4 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ee0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ef0: 95 47 73 35 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f00: a0 e1 64 21 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f10: 00 00 00 00 00 00 00 00 00 00 00 00 01 e9 00 00
0xe2be5f20: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f30: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be5f40: 02 be 61 e0 00 00 00 02 00 00 00 00 02 44 b3 a4
0xe2be5f50: 02 be 5f 90 00 00 00 08 02 be 5f e0 00 00 00 08
0xe2be5f60: 02 be 5f 80 00 ac 1b 14 00 00 00 00 00 00 00 00
0xe2be5f70: 05 b4 5f 90 02 be 5f e0 00 00 00 30 02 be 5f e0
0xe2be5f80: 02 be 5f c0 00 ac 1b f4 00 00 00 00 02 45 00 00
0xe2be5f90: 00 03 00 00 00 00 00 00 02 be 5f e0 00 00 00 30
0xe2be5fa0: 02 be 5f c0 00 ac 1b 14 61 f1 2e ae 02 45 00 00
0xe2be5fb0: 02 44 b3 74 02 be 5f d0 00 00 00 30 02 be 5f e0
0xe2be5fc0: 02 be 60 60 01 74 ff f8 00 00 00 00 00 00 08 00
0xe2be5fd0: 02 be 5f f0 00 e8 93 7e 02 be 5f f8 02 be 5f fc
0xe2be5fe0: 00 00 00 00 00 00 00 00 00 00 00 00 02 be 60 18
0xe2be5ff0: 02 be 60 10 00 e9 65 98 00 00 00 58 00 00 2a 4f
0xe2be6000: 02 be 60 10 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6010: 02 be 60 40 00 e8 c6 a0 00 00 11 17 00 00 00 00
0xe2be6020: 02 be 60 40 00 00 00 00 00 00 00 00 02 be 60 98
0xe2be6030: 02 27 00 00 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6040: 02 be 60 60 00 00 00 01 00 00 b0 30 02 be 60 98
0xe2be6050: 00 00 00 04 02 21 00 00 00 00 00 00 01 e9 00 00
0xe2be6060: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be6070: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be6080: 02 be 61 e0 00 00 00 02 00 00 00 00 02 be 61 70
0xe2be6090: 00 00 00 00 02 21 00 00 05 8d 34 c4 05 7d 92 44
Call trace:
Function Address = 0x8012a4b4
Function Address = 0x8017989c
Function Address = 0x80179b30
Function Address = 0x80127438
Function Address = 0x8012d734
Function Address = 0x80100a00
Function Address = 0xe0071004
Function Address = 0x8016ce0c
Function Address = 0x801223a0
Instruction dump:
41a2fe9c 812300ec 800200ec 7f890000 409efe8c 80010014 540b07b9 40a2fe80
4bfffe6c 80780290 7f64db78 4804ea35 <807f002c> 38800000 38a00080 3863000c
表1-3 display kernel deadloop命令显示信息描述表
发生死循环的内核线程的描述信息,包括死循环内核线程所在的CPU编号、内核线程连续运行的时间、内核线程的名称和编号 |
|
运行该内核线程的CPU的编号 |
|
内核线程被检测到发生死循环时,记录死循环发生的CPU上、最近五次的内核线程切换轨迹。包括内核线程的名称和内核线程切换时间点,时间精确到微秒 |
|
内核线程被检测到发生死循环时现场的寄存器信息。Reg表示寄存器名称,Val表示寄存器中保存的值 |
|
· reset kernel deadloop
display kernel deadloop configuration命令用来显示内核线程死循环监控参数配置。
display kernel deadloop configuration [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示内核线程死循环监控参数配置。
<Sysname> display kernel deadloop configuration
Thread dead loop detection: Enabled
Dead loop timer (in seconds): 60
Threads excluded from monitoring: 1
TID: 15 Name: co0
表1-4 display kernel deadloop configuration命令显示信息描述表
内核线程死循环判定周期(单位为秒),即内核线程连续运行时间大于n秒时,则判定为死循环 |
|
不进行死循环检测的内核线程列表,配置monitor kernel deadloop exclude-thread命令后才会显示该信息 |
|
display kernel exception命令用来显示内核线程的异常信息。
display kernel exception show-number [ offset ] [ verbose ] [ slot slot-number [ cpu cpu-number ] ]
show-number:需要显示的异常信息的数目,取值范围为1~20。
offset:开始显示的条目距最近条目的偏移,取值范围为0~19,缺省值为0。
verbose:显示详细信息。不指定该参数时,显示概要信息。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
当内核线程在运行过程中发生异常时,系统会自动记录异常信息,以便设备维护人员定位问题。
# 显示最近一条内核线程异常的概要信息。
<Sysname> display kernel exception 1
----------------- Exception record 1 -----------------
Description : Oops[#0]
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Instruction address : 0x4004158c
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (disk) module address (0xe00bd000)
# 显示最近一条内核线程异常的详细信息。
<Sysname> display kernel exception 1 verbose
----------------- Exception record 1 -----------------
Description : Oops[#0]
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Instruction address : 0x4004158c
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
Last 5 thread switches : migration/0 (11:16:00.823018)-->
swapper (11:16:00.833018)-->
kthreadd (11:16:00.833518)-->
swapper (11:16:00.833550)-->
disk (11:16:00.833560)
Register content:
Reg: r0, Val = 0x00000000 ; Reg: r1, Val = 0xe2be5ea0 ;
Reg: r2, Val = 0x00000000 ; Reg: r3, Val = 0x77777777 ;
Reg: r4, Val = 0x00000000 ; Reg: r5, Val = 0x00001492 ;
Reg: r6, Val = 0x00000000 ; Reg: r7, Val = 0x0000ffff ;
Reg: r8, Val = 0x77777777 ; Reg: r9, Val = 0x00000000 ;
Reg: r10, Val = 0x00000001 ; Reg: r11, Val = 0x0000002c ;
Reg: r12, Val = 0x057d9484 ; Reg: r13, Val = 0x00000000 ;
Reg: r14, Val = 0x00000000 ; Reg: r15, Val = 0x02000000 ;
Reg: r16, Val = 0xe2be5f00 ; Reg: r17, Val = 0x00000000 ;
Reg: r18, Val = 0x00000000 ; Reg: r19, Val = 0x00000000 ;
Reg: r20, Val = 0x024c10f8 ; Reg: r21, Val = 0x057d9244 ;
Reg: r22, Val = 0x00002000 ; Reg: r23, Val = 0x0000002c ;
Reg: r24, Val = 0x00000002 ; Reg: r25, Val = 0x24000024 ;
Reg: r26, Val = 0x00000000 ; Reg: r27, Val = 0x057d9484 ;
Reg: r28, Val = 0x0000002c ; Reg: r29, Val = 0x00000000 ;
Reg: r30, Val = 0x0000002c ; Reg: r31, Val = 0x00000000 ;
Reg: cr, Val = 0x84000028 ; Reg: nip, Val = 0x057d9550 ;
Reg: xer, Val = 0x00000000 ; Reg: lr, Val = 0x0186eff0 ;
Reg: ctr, Val = 0x682f7344 ; Reg: msr, Val = 0x00784b5c ;
Reg: trap, Val = 0x0000b030 ; Reg: dar, Val = 0x77777777 ;
Reg: dsisr, Val = 0x40000000 ; Reg: result, Val = 0x00020300 ;
Dump stack (total 1024 bytes, 16 bytes/line):
0xe2be5ea0: 02 be 5e c0 24 00 00 24 00 00 00 00 05 7d 94 84
0xe2be5eb0: 00 00 00 04 00 00 00 00 00 00 00 28 05 8d 34 c4
0xe2be5ec0: 02 be 60 a0 01 86 ef f0 00 00 00 00 00 00 00 00
0xe2be5ed0: 02 04 05 b4 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ee0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ef0: 95 47 73 35 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f00: a0 e1 64 21 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f10: 00 00 00 00 00 00 00 00 00 00 00 00 01 e9 00 00
0xe2be5f20: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f30: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be5f40: 02 be 61 e0 00 00 00 02 00 00 00 00 02 44 b3 a4
0xe2be5f50: 02 be 5f 90 00 00 00 08 02 be 5f e0 00 00 00 08
0xe2be5f60: 02 be 5f 80 00 ac 1b 14 00 00 00 00 00 00 00 00
0xe2be5f70: 05 b4 5f 90 02 be 5f e0 00 00 00 30 02 be 5f e0
0xe2be5f80: 02 be 5f c0 00 ac 1b f4 00 00 00 00 02 45 00 00
0xe2be5f90: 00 03 00 00 00 00 00 00 02 be 5f e0 00 00 00 30
0xe2be5fa0: 02 be 5f c0 00 ac 1b 14 61 f1 2e ae 02 45 00 00
0xe2be5fb0: 02 44 b3 74 02 be 5f d0 00 00 00 30 02 be 5f e0
0xe2be5fc0: 02 be 60 60 01 74 ff f8 00 00 00 00 00 00 08 00
0xe2be5fd0: 02 be 5f f0 00 e8 93 7e 02 be 5f f8 02 be 5f fc
0xe2be5fe0: 00 00 00 00 00 00 00 00 00 00 00 00 02 be 60 18
0xe2be5ff0: 02 be 60 10 00 e9 65 98 00 00 00 58 00 00 2a 4f
0xe2be6000: 02 be 60 10 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6010: 02 be 60 40 00 e8 c6 a0 00 00 11 17 00 00 00 00
0xe2be6020: 02 be 60 40 00 00 00 00 00 00 00 00 02 be 60 98
0xe2be6030: 02 27 00 00 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6040: 02 be 60 60 00 00 00 01 00 00 b0 30 02 be 60 98
0xe2be6050: 00 00 00 04 02 21 00 00 00 00 00 00 01 e9 00 00
0xe2be6060: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be6070: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be6080: 02 be 61 e0 00 00 00 02 00 00 00 00 02 be 61 70
0xe2be6090: 00 00 00 00 02 21 00 00 05 8d 34 c4 05 7d 92 44
Call trace:
Function Address = 0x8012a4b4
Function Address = 0x8017989c
Function Address = 0x80179b30
Function Address = 0x80127438
Function Address = 0x8012d734
Function Address = 0x80100a00
Function Address = 0xe0071004
Function Address = 0x8016ce0c
Function Address = 0x801223a0
Instruction dump:
41a2fe9c 812300ec 800200ec 7f890000 409efe8c 80010014 540b07b9 40a2fe80
4bfffe6c 80780290 7f64db78 4804ea35 <807f002c> 38800000 38a00080 3863000c
· reset kernel exception
display kernel reboot命令用来显示内核线程的重启信息。
display kernel reboot show-number [ offset ] [ verbose ] [ slot slot-number [ cpu cpu-number ] ]
show-number:需要显示的重启信息的数目,取值范围为1~20。
offset:需要显示的起始条目距最近条目的偏移,取值范围为0~19,缺省值为0。
verbose:表示显示详细信息。不指定该参数时,显示概要信息。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示最近一条内核线程重启的概要信息。
<Sysname> display kernel reboot 1
----------------- Reboot record 1 -----------------
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Reason : 0x31
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
# 显示最近一条内核线程重启的详细信息。
<Sysname> display kernel reboot 1 verbose
----------------- Reboot record 1 -----------------
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Reason : 0x31
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
Last 5 thread switches : migration/0 (11:16:00.823018)-->
swapper (11:16:00.833018)-->
kthreadd (11:16:00.833518)-->
swapper (11:16:00.833550)-->
disk (11:16:00.833560)
Dump stack (total 1024 bytes, 16 bytes/line):
0xe2be5ea0: 02 be 5e c0 24 00 00 24 00 00 00 00 05 7d 94 84
0xe2be5eb0: 00 00 00 04 00 00 00 00 00 00 00 28 05 8d 34 c4
0xe2be5ec0: 02 be 60 a0 01 86 ef f0 00 00 00 00 00 00 00 00
0xe2be5ed0: 02 04 05 b4 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ee0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ef0: 95 47 73 35 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f00: a0 e1 64 21 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f10: 00 00 00 00 00 00 00 00 00 00 00 00 01 e9 00 00
0xe2be5f20: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f30: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be5f40: 02 be 61 e0 00 00 00 02 00 00 00 00 02 44 b3 a4
0xe2be5f50: 02 be 5f 90 00 00 00 08 02 be 5f e0 00 00 00 08
0xe2be5f60: 02 be 5f 80 00 ac 1b 14 00 00 00 00 00 00 00 00
0xe2be5f70: 05 b4 5f 90 02 be 5f e0 00 00 00 30 02 be 5f e0
0xe2be5f80: 02 be 5f c0 00 ac 1b f4 00 00 00 00 02 45 00 00
0xe2be5f90: 00 03 00 00 00 00 00 00 02 be 5f e0 00 00 00 30
0xe2be5fa0: 02 be 5f c0 00 ac 1b 14 61 f1 2e ae 02 45 00 00
0xe2be5fb0: 02 44 b3 74 02 be 5f d0 00 00 00 30 02 be 5f e0
0xe2be5fc0: 02 be 60 60 01 74 ff f8 00 00 00 00 00 00 08 00
0xe2be5fd0: 02 be 5f f0 00 e8 93 7e 02 be 5f f8 02 be 5f fc
0xe2be5fe0: 00 00 00 00 00 00 00 00 00 00 00 00 02 be 60 18
0xe2be5ff0: 02 be 60 10 00 e9 65 98 00 00 00 58 00 00 2a 4f
0xe2be6000: 02 be 60 10 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6010: 02 be 60 40 00 e8 c6 a0 00 00 11 17 00 00 00 00
0xe2be6020: 02 be 60 40 00 00 00 00 00 00 00 00 02 be 60 98
0xe2be6030: 02 27 00 00 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6040: 02 be 60 60 00 00 00 01 00 00 b0 30 02 be 60 98
0xe2be6050: 00 00 00 04 02 21 00 00 00 00 00 00 01 e9 00 00
0xe2be6060: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be6070: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be6080: 02 be 61 e0 00 00 00 02 00 00 00 00 02 be 61 70
0xe2be6090: 00 00 00 00 02 21 00 00 05 8d 34 c4 05 7d 92 44
Call trace:
Function Address = 0x8012a4b4
Function Address = 0x8017989c
Function Address = 0x80179b30
Function Address = 0x80127438
Function Address = 0x8012d734
Function Address = 0x80100a00
Function Address = 0xe0071004
Function Address = 0x8016ce0c
Function Address = 0x801223a0
表1-5 display kernel reboot命令显示信息描述表
描述 |
|
系统重启时,记录重启的CPU上、最近五次的内核线程切换轨迹。包括内核线程的名称和内核线程切换时间点,时间精确到微秒 |
|
· reset kernel reboot
display kernel starvation命令用来显示内核线程饿死信息。
display kernel starvation show-number [ offset ] [ verbose ] [ slot slot-number [ cpu cpu-number ] ]
show-number:需要显示的内核线程饿死信息的数目,取值范围为1~20。
offset:需要显示的起始条目距最近条目的偏移,取值范围为0~19,缺省值为0。
verbose:表示显示详细信息。不指定该参数时,显示概要信息。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示最近一条内核线程饿死的概要信息。
<Sysname> display kernel starvation 1
----------------- Starvation record 1 -----------------
Description : INFO: task comsh: 16306 blocked for more than 10 seconds.
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Instruction address : 0x4004158c
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
# 显示最近一条内核线程饿死的详细信息。
<Sysname> display kernel starvation 1 verbose
----------------- Starvation record 1 -----------------
Description : INFO: task comsh: 16306 blocked for more than 10 seconds.
Recorded at : 2013-05-01 11:16:00.823018
Occurred at : 2013-05-01 11:16:00.823018
Instruction address : 0x4004158c
Thread : comsh (TID: 16306)
Context : thread context
Slot : 1
CPU ID : 0
Kernel module info : module name (mrpnc) module address (0xe332a000)
module name (12500) module address (0xe00bd000)
Last 5 thread switches : migration/0 (11:16:00.823018)-->
swapper (11:16:00.833018)-->
kthreadd (11:16:00.833518)-->
swapper (11:16:00.833550)-->
disk (11:16:00.833560)
Register content:
Reg: r0, Val = 0x00000000 ; Reg: r1, Val = 0xe2be5ea0 ;
Reg: r2, Val = 0x00000000 ; Reg: r3, Val = 0x77777777 ;
Reg: r4, Val = 0x00000000 ; Reg: r5, Val = 0x00001492 ;
Reg: r6, Val = 0x00000000 ; Reg: r7, Val = 0x0000ffff ;
Reg: r8, Val = 0x77777777 ; Reg: r9, Val = 0x00000000 ;
Reg: r10, Val = 0x00000001 ; Reg: r11, Val = 0x0000002c ;
Reg: r12, Val = 0x057d9484 ; Reg: r13, Val = 0x00000000 ;
Reg: r14, Val = 0x00000000 ; Reg: r15, Val = 0x02000000 ;
Reg: r16, Val = 0xe2be5f00 ; Reg: r17, Val = 0x00000000 ;
Reg: r18, Val = 0x00000000 ; Reg: r19, Val = 0x00000000 ;
Reg: r20, Val = 0x024c10f8 ; Reg: r21, Val = 0x057d9244 ;
Reg: r22, Val = 0x00002000 ; Reg: r23, Val = 0x0000002c ;
Reg: r24, Val = 0x00000002 ; Reg: r25, Val = 0x24000024 ;
Reg: r26, Val = 0x00000000 ; Reg: r27, Val = 0x057d9484 ;
Reg: r28, Val = 0x0000002c ; Reg: r29, Val = 0x00000000 ;
Reg: r30, Val = 0x0000002c ; Reg: r31, Val = 0x00000000 ;
Reg: cr, Val = 0x84000028 ; Reg: nip, Val = 0x057d9550 ;
Reg: xer, Val = 0x00000000 ; Reg: lr, Val = 0x0186eff0 ;
Reg: ctr, Val = 0x682f7344 ; Reg: msr, Val = 0x00784b5c ;
Reg: trap, Val = 0x0000b030 ; Reg: dar, Val = 0x77777777 ;
Reg: dsisr, Val = 0x40000000 ; Reg: result, Val = 0x00020300 ;
Dump stack (total 1024 bytes, 16 bytes/line):
0xe2be5ea0: 02 be 5e c0 24 00 00 24 00 00 00 00 05 7d 94 84
0xe2be5eb0: 00 00 00 04 00 00 00 00 00 00 00 28 05 8d 34 c4
0xe2be5ec0: 02 be 60 a0 01 86 ef f0 00 00 00 00 00 00 00 00
0xe2be5ed0: 02 04 05 b4 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ee0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5ef0: 95 47 73 35 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f00: a0 e1 64 21 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f10: 00 00 00 00 00 00 00 00 00 00 00 00 01 e9 00 00
0xe2be5f20: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be5f30: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be5f40: 02 be 61 e0 00 00 00 02 00 00 00 00 02 44 b3 a4
0xe2be5f50: 02 be 5f 90 00 00 00 08 02 be 5f e0 00 00 00 08
0xe2be5f60: 02 be 5f 80 00 ac 1b 14 00 00 00 00 00 00 00 00
0xe2be5f70: 05 b4 5f 90 02 be 5f e0 00 00 00 30 02 be 5f e0
0xe2be5f80: 02 be 5f c0 00 ac 1b f4 00 00 00 00 02 45 00 00
0xe2be5f90: 00 03 00 00 00 00 00 00 02 be 5f e0 00 00 00 30
0xe2be5fa0: 02 be 5f c0 00 ac 1b 14 61 f1 2e ae 02 45 00 00
0xe2be5fb0: 02 44 b3 74 02 be 5f d0 00 00 00 30 02 be 5f e0
0xe2be5fc0: 02 be 60 60 01 74 ff f8 00 00 00 00 00 00 08 00
0xe2be5fd0: 02 be 5f f0 00 e8 93 7e 02 be 5f f8 02 be 5f fc
0xe2be5fe0: 00 00 00 00 00 00 00 00 00 00 00 00 02 be 60 18
0xe2be5ff0: 02 be 60 10 00 e9 65 98 00 00 00 58 00 00 2a 4f
0xe2be6000: 02 be 60 10 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6010: 02 be 60 40 00 e8 c6 a0 00 00 11 17 00 00 00 00
0xe2be6020: 02 be 60 40 00 00 00 00 00 00 00 00 02 be 60 98
0xe2be6030: 02 27 00 00 00 00 00 00 00 00 00 00 02 be 60 68
0xe2be6040: 02 be 60 60 00 00 00 01 00 00 b0 30 02 be 60 98
0xe2be6050: 00 00 00 04 02 21 00 00 00 00 00 00 01 e9 00 00
0xe2be6060: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
0xe2be6070: 00 00 00 00 00 00 00 00 02 be 66 c0 02 be 66 d0
0xe2be6080: 02 be 61 e0 00 00 00 02 00 00 00 00 02 be 61 70
0xe2be6090: 00 00 00 00 02 21 00 00 05 8d 34 c4 05 7d 92 44
Call trace:
Function Address = 0x8012a4b4
Function Address = 0x8017989c
Function Address = 0x80179b30
Function Address = 0x80127438
Function Address = 0x8012d734
Function Address = 0x80100a00
Function Address = 0xe0071004
Function Address = 0x8016ce0c
Function Address = 0x801223a0
Instruction dump:
41a2fe9c 812300ec 800200ec 7f890000 409efe8c 80010014 540b07b9 40a2fe80
4bfffe6c 80780290 7f64db78 4804ea35 <807f002c> 38800000 38a00080 3863000c
· reset kernel starvation
display kernel starvation configuration命令用来显示内核线程的饿死监控参数的配置。
display kernel starvation configuration [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示内核线程饿死监控参数配置。
<Sysname> display kernel starvation configuration
Thread starvation detection: Enabled
Starvation timer (in seconds): 10
Threads excluded from monitoring: 1
TID: 123 Name: co0
表1-6 display kernel starvation configuration命令显示信息描述表
内核线程饿死判定周期(单位为秒)。即如果内核线程在n秒内一直不能运行,则判定为饿死 |
|
· monitor kernel starvation enable
· monitor kernel starvation exclude-thread
· monitor kernel starvation time
display process命令用来显示进程的状态信息。
display process [ all | job job-id | name process-name ] [ slot slot-number [ cpu cpu-number ] ]
all:显示所有进程的状态信息。指定all参数和不指定任何可选参数时,命令行的执行效果相同。
job job-id:任务编号,用于唯一标识一个进程,该编号不会随着进程的重启而改变,取值范围为1~2147483647。
name process-name:进程名称,为1~15个字符的字符串,不区分大小写,不能包含问号和空格。
slot slot-number:表示设备在IRF中的成员编号,不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示进程scmd的状态信息。
<Sysname> display process name scmd
Job ID: 1
PID: 1
Parent JID: 0
Parent PID: 0
Executable path: -
Instance: 0
Respawn: OFF
Respawn count: 1
Max. spawns per minute: 0
Last started: Wed Jun 1 14:45:46 2013
Process state: sleeping
Max. core: 0
ARGS: -
TID LAST_CPU Stack PRI State HH:MM:SS:MESC Name
1 0 0K 120 S 0:0:5:220 scmd
表1-7 display process name命令显示信息描述表
· ON表示自动重启 · OFF表示不自动重启 |
|
· running,运行状态或正在队列中等待调度 · sleeping,可中断睡眠状态 · traced or stopped,暂停状态 · uninterruptible sleep,不可中断睡眠状态 · zombie,僵死状态 |
|
进程最多可以生成的core文件的数量,如果为0表示不生成core文件(进程异常重启一次,会产生一个core文件。如果生成的core文件的数目达到最大值,则不再生成core文件。软件开发和维护人员能够根据core文件的内容来定位异常的原因和异常的位置) |
|
· R:running,运行状态或正在队列中等待调度 · S:sleeping,可中断睡眠状态 · T:traced or stopped,暂停状态 · D:uninterruptible sleep,不可中断睡眠状态 · Z:zombie,僵死状态 |
|
# 显示所有进程的状态信息。
JID PID %CPU %MEM STAT PRI TTY HH:MM:SS COMMAND
1 1 0.0 0.0 S 120 - 00:00:04 scmd
2 2 0.0 0.0 S 115 - 00:00:00 [kthreadd]
3 3 0.0 0.0 S 99 - 00:00:00 [migration/0]
4 4 0.0 0.0 S 115 - 00:00:05 [ksoftirqd/0]
5 5 0.0 0.0 S 99 - 00:00:00 [watchdog/0]
6 6 0.0 0.0 S 115 - 00:00:00 [events/0]
7 7 0.0 0.0 S 115 - 00:00:00 [khelper]
8 8 0.0 0.0 S 115 - 00:00:00 [kblockd/0]
9 9 0.0 0.0 S 115 - 00:00:00 [ata/0]
10 10 0.0 0.0 S 115 - 00:00:00 [ata_aux]
11 11 0.0 0.0 S 115 - 00:00:00 [kseriod]
12 12 0.0 0.0 S 120 - 00:00:00 [vzmond]
13 13 0.0 0.0 S 120 - 00:00:00 [pdflush]
14 14 0.0 0.0 S 120 - 00:00:00 [pdflush]
15 15 0.0 0.0 S 115 - 00:00:00 [kswapd0]
16 16 0.0 0.0 S 115 - 00:00:00 [aio/0]
17 17 0.0 0.0 S 115 - 00:00:00 [scsi_eh_0]
18 18 0.0 0.0 S 115 - 00:00:00 [scsi_eh_1]
19 19 0.0 0.0 S 115 - 00:00:00 [scsi_eh_2]
35 35 0.0 0.0 D 100 - 00:00:00 [lipc_topology]
---- More ----
表1-8 display process all命令显示信息描述
CPU使用率(用百分比表示) |
|
· R:running,运行状态或处于运行队列 · S:sleeping,可中断睡眠状态 · T:traced or stopped,暂停状态 · D:uninterruptible sleep,不可中断睡眠状态 · Z:zombie,僵死状态 |
|
进程名称以及进程运行的参数(如果进程名称带有“[ ]”标记,则表示内核线程) |
display process cpu命令用来显示所有进程的CPU使用率信息。
display process cpu [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示设备在IRF中的成员编号,不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示所有进程CPU使用率信息。
CPU utilization in 5 secs: 16.8%; 1 min: 4.7%; 5 mins: 4.7%
JID 5Sec 1Min 5Min Name
1 0.0% 0.0% 0.0% scmd
2 0.0% 0.0% 0.0% [kthreadd]
3 0.1% 0.0% 0.0% [ksoftirqd/0]
4 0.0% 0.0% 0.0% [watchdog/0]
5 0.0% 0.0% 0.0% [events/0]
6 0.0% 0.0% 0.0% [khelper]
29 0.0% 0.0% 0.0% [kblockd/0]
49 0.0% 0.0% 0.0% [vzmond]
52 0.0% 0.0% 0.0% [pdflush]
53 0.0% 0.0% 0.0% [pdflush]
54 0.0% 0.0% 0.0% [kswapd0]
110 0.0% 0.0% 0.0% [aio/0]
712 0.0% 0.0% 0.0% [mtdblockd]
719 0.0% 0.0% 0.0% [TNetJob]
720 0.0% 0.0% 0.0% [TMTH]
727 0.0% 0.0% 0.0% [CF]
730 0.0% 0.0% 0.0% [DIBC]
752 0.0% 0.0% 0.0% [lipc_topology]
762 0.0% 0.0% 0.0% [MNET]
763 0.0% 0.0% 0.0% [SYSM]
---- More ----
表1-9 display process cpu 命令显示信息描述表
系统最近5秒CPU使用率;最近1分钟CPU使用率;最近5分钟CPU使用率 |
|
最近5秒钟内进程的CPU使用率 |
|
最近1分钟内进程的CPU使用率 |
|
最近5分钟内进程的CPU使用率 |
|
进程名称(如果进程名称带有“[ ]”标记,则表示该进程为内核线程) |
display process log命令用来显示所有用户态进程的日志信息。
display process log [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示设备在IRF中的成员编号,不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 显示所有用户态进程的日志信息。
Name JID PID Abort Core Start-time End-time
knotify 156 156 N N 2013-06-11 09:31:02 2013-06-11 09:31:02
knotify 158 158 N N 2013-06-11 09:31:02 2013-06-11 09:31:02
knotify 195 195 N N 2013-06-11 09:31:03 2013-06-11 09:31:03
pkg_update 203 203 N N 2013-06-11 09:31:06 2013-06-11 09:31:06
autocfgd 219 219 N N 2013-06-11 09:31:13 2013-06-11 09:31:13
comsh 202 202 N N 2013-06-11 09:31:05 2013-06-11 09:31:13
表1-10 display process log命令显示信息描述表
· Y表示异常退出 · N表示正常退出 |
|
是否产生core文件 · Y表示产生 · N表示未产生 |
|
display process memory命令用来显示所有用户态进程的代码段、数据段以及堆栈等的内存使用信息。
display process memory [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示设备在IRF中的成员编号,不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
用户态进程启动时,会向系统申请Text、Data、Stack和Dynamic类型的内存。
· Text类型的内存用来存放用户态进程的代码。
· Data类型的内存用来存放用户态进程的数据。
· Stack内存指的是栈内存,一般存放临时数据。
· Dynamic类型的内存指的是堆内存(heap),由系统根据用户态进程运行需要进行动态分配(malloc)和释放(free),可使用display process memory heap命令显示Dynamic类型内存的详细信息。
# 显示所有用户态进程的内存使用信息。
<Sysname> display process memory
JID Text Data Stack Dynamic Name
1 384 1800 16 36 scmd
2 0 0 0 0 [kthreadd]
3 0 0 0 0 [ksoftirqd/0]
4 0 0 0 0 [watchdog/0]
5 0 0 0 0 [events/0]
6 0 0 0 0 [khelper]
29 0 0 0 0 [kblockd/0]
49 0 0 0 0 [vzmond]
52 0 0 0 0 [pdflush]
---- More ----
表1-11 display process memory命令显示信息描述表
用户态进程占用的代码段大小,单位为KB(内核线程该项大小为0) |
|
用户态进程占用的数据段大小,单位为KB(内核线程该项大小为0) |
|
用户态进程占用的堆栈大小,单位为KB(内核线程该项大小为0) |
|
用户态进程动态申请内存大小,单位为KB(内核线程该项大小为0) |
|
用户态进程名称(如果用户态进程名称带有“[ ]”标记,则表示该进程为内核线程) |
· display process memory heap address
· display process memory heap size
display process memory heap命令用来显示指定用户态进程的堆内存统计信息。
display process memory heap job job-id [ verbose ] [ slot slot-number [ cpu cpu-number ] ]
job job-id:任务编号,用于唯一标识一个用户态进程,该编号不会随着用户态进程的重启而改变。取值范围为1~2147483647。
verbose:显示内存详细统计信息。不指定该参数时,显示内存概要统计信息。
slot slot-number:表示设备在IRF中的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
系统的堆内存由固定大小(比如size=16字节、size=64字节等)的内存块构成,用于存放用户态进程运行过程中需要用到的数据或者中间变量。当用户态进程启动时,系统会根据用户态进程运行需要,给用户态进程动态分配堆内存。用户态进程的堆内存信息可使用display process memory heap命令显示。
每个内存块都有地址,该地址用十六进制数表示,可通过display process memory heap size命令显示。用户使用内存块的地址可以访问内存块,获取内存块的内容,内存块的内容可通过display process memory heap address命令显示。
# 显示job 148的堆内存概要统计信息。
<Sysname> display process memory heap job 148
Total virtual memory heap space(in bytes) : 2228224
Total physical memory heap space(in bytes) : 262144
Total allocated memory(in bytes) : 161576
# 显示job 148的堆内存详细统计信息。
<Sysname> display process memory heap job 148 verbose
Heap usage:
Size Free Used Total Free Ratio
16 8 52 60 13%
64 3 1262 1265 0.2%
128 2 207 209 1%
512 3 55 58 5.1%
4096 3 297 300 1%
8192 1 19 20 5%
81920 0 1 1 0%
Summary:
Total virtual memory heap space (in bytes) : 2293760
Total physical memory heap space (in bytes) : 58368
Total allocated memory (in bytes) : 42368
以上显示信息表明:job 148分得size大小16字节的内存块60个(已用52个,还有8个未使用),size大小为64字节的内存块1265个(已用1262个,还有3个未使用),以此类推。
表1-12 display process memory heap命令显示信息描述表
指定大小内存块总个数,为Free和Used之和 |
|
Free与Total的比率,可以反映这种大小内存块的碎片情况 |
· display process memory heap address
· display process memory heap size
display process memory heap address命令用来显示从指定地址开始的内存空间的内容。
job job-id:任务编号,用于唯一标识一个用户态进程,该编号不会随着用户态进程的重启而改变,取值范围为1~2147483647。
address starting-address:内存块的起始地址。
length memory-length:内存的长度,取值范围为1~1024,单位为字节。
slot slot-number:表示设备在IRF中的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
当用户态进程运行异常时,使用该命令可以帮助设备维护人员诊断和定位问题。
# 显示job 1从地址0xb7e30580开始,长度为128字节的内存空间的内容。
<Sysname> display process memory heap job 1 address b7e30580 length 128
B7E30580: 14 00 EF FF 00 00 00 00 E4 39 E2 B7 7C 05 E3 B7 .........9..|...
B7E30590: 14 00 EF FF 2F 73 62 69 6E 2F 73 6C 62 67 64 00 ..../sbin/slbgd.
B7E305A0: 14 00 EF FF 00 00 00 00 44 3B E2 B7 8C 05 E3 B7 ........D;......
B7E305B0: 14 00 EF FF 2F 73 62 69 6E 2F 6F 73 70 66 64 00 ..../sbin/ospfd.
B7E305C0: 14 00 EF FF 00 00 00 00 A4 3C E2 B7 AC 05 E3 B7 .........<......
B7E305D0: 14 00 EF FF 2F 73 62 69 6E 2F 6D 73 74 70 64 00 ..../sbin/mstpd.
B7E305E0: 14 00 EF FF 00 00 00 00 04 3E E2 B7 CC 05 E3 B7 .........>......
B7E305F0: 14 00 EF FF 2F 73 62 69 6E 2F 6E 74 70 64 00 00 ..../sbin/ntpd..
· display process memory heap size
display process memory heap size命令用来显示指定大小已使用内存块的地址。
job job-id:任务编号,用于唯一标识一个用户态进程,该编号不会随着用户态进程的重启而改变,取值范围为1~2147483647。
size memory-size:内存块大小,取值范围为1~4294967295。
offset offset-size:要查询的内存块的偏移,取值范围为0~4294967295,缺省值为128。比如,系统给job 1分配了size为16字节的内存块100个,用户态进程当前已用了66个,如果执行命令display process memory heap job 1 size 16 offset 50,则会显示该用户态进程第51到第66个size为16字节的内存块的地址。
slot slot-number:表示设备在IRF中的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
该命令显示的地址为十六进制格式,使用该地址,通过display process memory heap address命令可以显示该地址内存的具体内容。
# 显示job 1已使用的size大小为16字节的内存块的地址。
<Sysname> display process memory heap job 1 size 16
0xb7e300c0 0xb7e300d0 0xb7e300e0 0xb7e300f0
0xb7e30100 0xb7e30110 0xb7e30120 0xb7e30130
0xb7e30140 0xb7e30150 0xb7e30160 0xb7e30170
0xb7e30180 0xb7e30190 0xb7e301a0 0xb7e301b0
0xb7e301c0 0xb7e301d0 0xb7e301e0 0xb7e301f0
0xb7e30200 0xb7e30210 0xb7e30220 0xb7e30230
# 显示job 1已使用的size大小为16字节的内存块的地址,从第5个已使用内存块开始显示。
<Sysname> display process memory heap job 1 size 16 offset 4
0xb7e30100 0xb7e30110 0xb7e30120 0xb7e30130
0xb7e30140 0xb7e30150 0xb7e30160 0xb7e30170
0xb7e30180 0xb7e30190 0xb7e301a0 0xb7e301b0
0xb7e301c0 0xb7e301d0 0xb7e301e0 0xb7e301f0
0xb7e30200 0xb7e30210 0xb7e30220 0xb7e30230
· display process memory heap address
exception filepath命令用来设置core文件的保存路径。
undo exception filepath命令用来将core文件的保存路径设置为空。
undo exception filepath directory
Core文件的保存路径为主设备的根目录。
directory:表示core文件的保存路径,只能为Flash的根目录。
Core文件仅保存在主设备的根目录下。
当core文件的保存路径为空或无法正常访问时,系统将无法保存core文件,也无法记录用户态进程异常时的上下文信息。
# 设置core文件的保存路径为flash:/。
<Sysname> exception filepath flash:/
monitor kernel deadloop enable命令用来开启内核线程死循环检测功能。
undo monitor kernel deadloop enable命令用来关闭内核线程死循环检测功能。
monitor kernel deadloop enable [ slot slot-number [ cpu cpu-number ] ]
undo monitor kernel deadloop enable [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
在内核态空间中,所有资源都是共享的,多个内核线程之间通过任务调度协调工作。如果某个内核线程长时间一直占用CPU,就会导致其它内核线程获取不到运行机会,整个系统挂死,我们称这种现象为死循环。
开启内核线程死循环检测功能后,如果系统发现某内核线程在指定时间内一直占用CPU,则判定该内核线程为死循环。系统会记录一条死循环信息供管理员查询,并自动重启整个系统来解除死循环。
开机后,系统会自动检测内核线程是否发生了死循环。如果需要配置,请在H3C工程师的指导下进行,以免引起系统异常。
# 开启内核线程死循环检测功能。
[Sysname] monitor kernel deadloop enable
· display kernel deadloop
· display kernel deadloop configuration
· monitor kernel deadloop exclude-thread
· monitor kernel deadloop time
monitor kernel deadloop exclude-thread命令用来配置不检测指定内核线程是否发生了死循环。
undo monitor kernel deadloop exclude-thread命令用来恢复对指定内核线程是否发生了死循环进行检测。
monitor kernel deadloop exclude-thread tid [ slot slot-number [ cpu cpu-number ] ]
undo monitor kernel deadloop exclude-thread [ tid ] [ slot slot-number [ cpu cpu-number ] ]
开启内核线程死循环检测功能后,系统会监控所有内核线程是否发生了死循环。
tid:表示内核线程编号,用于唯一标识一个内核线程,取值范围为1~2147483647。不指定该参数时,表示恢复到缺省情况。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
缺省情况下,系统会检测所有内核线程是否发生了死循环。多次执行该命令,可以配置对多个内核线程不进行检测,最多可以配置128个。
开机后,系统会自动检测内核线程是否发生了死循环。如果需要配置,请在H3C工程师的指导下进行,以免引起系统异常。
# 对编号为15的内核线程不进行死循环检测。
[Sysname]monitor kernel deadloop exclude-thread 15
· display kernel deadloop configuration
· display kernel deadloop
· monitor kernel deadloop enable
· monitor kernel deadloop time
monitor kernel deadloop time命令用来配置判定内核线程是否死循环的时长。
undo monitor kernel deadloop time命令用来恢复缺省情况。
monitor kernel deadloop time interval [ slot slot-number [ cpu cpu-number ] ]
undo monitor kernel deadloop time [ slot slot-number [ cpu cpu-number ] ]
当某内核线程连续运行超过8秒钟,则判定为死循环。
time interval:表示内核线程死循环判定时长,取值范围为1~65535,单位为秒。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
开启内核线程检测功能后,如果某内核线程持续运行指定时间,则认为该内核线程已经死循环,系统将记录一条死循环信息并重启。
开机后,系统会自动检测内核线程是否发生了死循环。如果需要配置,请在H3C工程师的指导下进行,以免引起系统异常。
# 配置当某内核线程连续运行超过8秒钟,则判定为死循环。
[Sysname] monitor kernel deadloop time 8
· display kernel deadloop configuration
· display kernel deadloop
· monitor kernel deadloop enable
· monitor kernel deadloop exclude-thread
monitor kernel starvation enable命令用来开启内核线程饿死检测功能。
undo monitor kernel starvation enable命令用来关闭内核线程饿死检测功能。
monitor kernel starvation enable [ slot slot-number [ cpu cpu-number ] ]
undo monitor kernel starvation enable [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
如果内核线程本身的触发条件没有达到,会导致该内核线程在一段时间内一直得不到调度,我们称这种现象为饿死。
开启内核线程饿死检测功能后,当系统检测到某内核线程饿死时,会记录一条饿死信息供管理员查询。
内核线程饿死并不会影响整个系统的运行,当触发条件达到,处于饿死状态的内核线程会自动执行。
开机后,系统会自动检测内核线程是否发生了饿死。如果需要配置,请在H3C工程师的指导下进行,以免引起系统异常。
# 开启内核线程饿死检测功能。
[Sysname] monitor kernel starvation enable
· display kernel starvation configuration
· display kernel starvation
· monitor kernel starvation time
· monitor kernel starvation exclude-thread
monitor kernel starvation exclude-thread命令用来配置不检测指定内核线程是否发生了饿死。
undo monitor kernel starvation exclude-thread命令用来恢复对指定内核线程是否发生了饿死进行检测。
monitor kernel starvation exclude-thread tid [ slot slot-number [ cpu cpu-number ] ]
undo monitor kernel starvation exclude-thread [ tid ] [ slot slot-number [ cpu cpu-number ] ]
开启内核线程死循环检测功能后,会监控所有内核线程是否发生了饿死。
tid:表示内核线程编号,用于唯一标识一个内核线程,取值范围为1~2147483647。不指定该参数时,表示恢复到缺省情况。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
缺省情况下,系统会检测所有内核线程是否发生了饿死。多次执行该命令,可以配置对多个内核线程不进行检测,最多可以配置128个。
开机后,系统会自动检测内核线程是否发生了饿死。如果需要配置,请在H3C工程师的指导下进行,以免引起系统异常。
# 对编号为15的内核线程不进行饿死检测。
[Sysname] monitor kernel starvation exclude-thread 15
· display kernel starvation
· display kernel starvation configuration
· monitor kernel starvation time
· monitor kernel starvation enable
monitor kernel starvation time命令用来配置判定内核线程是否饿死的时长。
undo monitor kernel starvation time命令用来恢复缺省情况。
monitor kernel starvation time interval [ slot slot-number [ cpu cpu-number ] ]
undo monitor kernel starvation time [ slot slot-number [ cpu cpu-number ] ]
当某内核线程在120秒内一直没有运行,则认为该内核线程被饿死。
time interval:表示内核线程饿死判定时长,取值范围为1~65535,单位为秒。
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
开机后,系统会自动检测内核线程是否发生了饿死。如果需要配置,请在H3C工程师的指导下进行,以免引起系统异常。
# 配置当内核线程在120秒内一直没有运行,则认为该内核线程被饿死。
[Sysname] monitor kernel starvation time 120
· display kernel starvation
· display kernel starvation configuration
· monitor kernel starvation enable
· monitor kernel starvation exclude-thread
monitor process命令用来显示进程的统计信息。
monitor process [ dumbtty ] [ iteration number ] [ slot slot-number [ cpu cpu-number ] ]
dumbtty:以哑终端方式显示进程统计信息(即屏幕不支持定时刷新统计信息)。指定该参数时,全部进程的统计信息以CPU使用率降序排列输出到屏幕上;不指定该参数时,统计信息以交互模式显示,缺省情况下按CPU占用率降序显示前10个进程的统计信息,且每隔5秒刷新一次。
iteration number:表示进程统计信息的显示次数,取值范围为1~4294967295。指定dumbtty参数时,number的缺省值为1;不指定dumbtty且不配置number参数时,表示显示次数没有限制,统计信息会每隔5秒刷新一次,一直显示。
slot slot-number:表示设备在IRF中的成员编号,不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
不指定dumbtty参数的情况下,统计信息以交互模式显示。
· 交互模式下,系统会自动计算可显示的进程个数,超过屏幕范围的不显示。
· 交互模式下,用户可通过输入表1-13中指定的交互命令字来执行相应的操作。
表1-13 monitor process命令支持的交互命令字描述表
?或h |
|
各物理CPU状态的显示开关。比如: (1) 输入1,分别显示各物理CPU的参数值 (2) 再次输入1,显示所有CPU的参数的平均值 (3) 第三次输入1,又分别显示各物理CPU的参数值 缺省情况下,显示所有CPU的参数的平均值 |
|
按CPU占用率降序排列,缺省情况下采用降序排列 |
|
设置统计信息的更新时间间隔,取值范围为1~2147483647秒,缺省值为5秒 |
|
改变显示的进程个数,取值范围为0~2147483647(缺省值为10个,0表示不作限制);超过屏幕范围时,仍只显示一屏内可容纳的进程个数 |
|
# 以哑终端方式显示进程统计信息。(使用该方式显示时,系统会一次显示所有进程的统计信息,并且不支持定时刷新,显示完毕后,会退回到命令视图)
<Sysname> monitor process dumbtty
76 processes; 103 threads; 687 fds
Thread states: 1 running, 102 sleeping, 0 stopped, 0 zombie
CPU states: 77.16% idle, 0.00% user, 14.96% kernel, 7.87% interrupt
Memory: 496M total, 341M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
1047 1047 120 R 9 1420K 00:02:23 13.53% diagd
1 1 120 S 17 1092K 00:00:20 7.61% scmd
1000 1000 115 S 0 0K 00:00:09 0.84% [sock/1]
1026 1026 120 S 20 26044K 00:00:05 0.84% syslogd
2 2 115 S 0 0K 00:00:00 0.00% [kthreadd]
3 3 99 S 0 0K 00:00:00 0.00% [migration/0]
4 4 115 S 0 0K 00:00:06 0.00% [ksoftirqd/0]
5 5 99 S 0 0K 00:00:00 0.00% [watchdog/0]
6 6 115 S 0 0K 00:00:01 0.00% [events/0]
7 7 115 S 0 0K 00:00:00 0.00% [khelper]
4797 4797 120 S 8 28832K 00:00:02 0.00% comsh
5117 5117 120 S 8 1496K 00:00:00 0.00% top
<Sysname>
# 以哑终端方式显示进程统计信息,并且执行一次命令显示两次统计结果。
<Sysname> monitor process dumbtty iteration 2
76 processes; 103 threads; 687 fds
Thread states: 1 running, 102 sleeping, 0 stopped, 0 zombie
CPU states: 44.84% idle, 0.51% user, 39.17% kernel, 15.46% interrupt
Memory: 496M total, 341M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
1047 1047 120 R 9 1420K 00:02:30 37.11% diagd
1 1 120 S 17 1092K 00:00:21 11.34% scmd
1000 1000 115 S 0 0K 00:00:09 2.06% [sock/1]
1026 1026 120 S 20 26044K 00:00:05 1.54% syslogd
1027 1027 120 S 12 9280K 00:01:12 1.03% devd
4 4 115 S 0 0K 00:00:06 0.51% [ksoftirqd/0]
1009 1009 115 S 0 0K 00:00:08 0.51% [karp/1]
1010 1010 115 S 0 0K 00:00:13 0.51% [kND/1]
5373 5373 120 S 8 1496K 00:00:00 0.51% top
2 2 115 S 0 0K 00:00:00 0.00% [kthreadd]
3 3 99 S 0 0K 00:00:00 0.00% [migration/0]
5 5 99 S 0 0K 00:00:00 0.00% [watchdog/0]
6 6 115 S 0 0K 00:00:01 0.00% [events/0]
7 7 115 S 0 0K 00:00:00 0.00% [khelper]
4796 4796 120 S 11 2744K 00:00:00 0.00% login
4797 4797 120 S 8 28832K 00:00:03 0.00% comsh
// 5秒钟后,系统会自动统计一次,并显示统计信息如下。(相当于执行了两次monitor process dumbtty,两次执行的时间间隔为5秒)
76 processes; 103 threads; 687 fds
Thread states: 1 running, 102 sleeping, 0 stopped, 0 zombie
CPU states: 78.71% idle, 0.16% user, 14.86% kernel, 6.25% interrupt
Memory: 496M total, 341M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
1047 1047 120 R 9 1420K 00:02:31 14.25% diagd
1 1 120 S 17 1092K 00:00:21 4.25% scmd
1027 1027 120 S 12 9280K 00:01:12 1.29% devd
1000 1000 115 S 0 0K 00:00:09 0.37% [sock/1]
5373 5373 120 S 8 1500K 00:00:00 0.37% top
6 6 115 S 0 0K 00:00:01 0.18% [events/0]
1009 1009 115 S 0 0K 00:00:08 0.18% [karp/1]
1010 1010 115 S 0 0K 00:00:13 0.18% [kND/1]
4795 4795 120 S 11 2372K 00:00:01 0.18% telnetd
2 2 115 S 0 0K 00:00:00 0.00% [kthreadd]
3 3 99 S 0 0K 00:00:00 0.00% [migration/0]
4 4 115 S 0 0K 00:00:06 0.00% [ksoftirqd/0]
5 5 99 S 0 0K 00:00:00 0.00% [watchdog/0]
7 7 115 S 0 0K 00:00:00 0.00% [khelper]
4796 4796 120 S 11 2744K 00:00:00 0.00% login
4797 4797 120 S 8 28832K 00:00:03 0.00% comsh
<Sysname>
# 以交互方式显示进程统计信息。
76 processes; 103 threads; 687 fds
Thread states: 1 running, 102 sleeping, 0 stopped, 0 zombie
CPU states: 78.98% idle, 0.16% user, 14.57% kernel, 6.27% interrupt
Memory: 496M total, 341M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
1047 1047 120 R 9 1420K 00:02:39 14.13% diagd
1 1 120 S 17 1092K 00:00:23 3.98% scmd
1027 1027 120 S 12 9280K 00:01:13 1.44% devd
1000 1000 115 S 0 0K 00:00:09 0.36% [sock/1]
1009 1009 115 S 0 0K 00:00:09 0.36% [karp/1]
4 4 115 S 0 0K 00:00:06 0.18% [ksoftirqd/0]
1010 1010 115 S 0 0K 00:00:13 0.18% [kND/1]
4795 4795 120 S 11 2372K 00:00:01 0.18% telnetd
5491 5491 120 S 8 1500K 00:00:00 0.18% top
2 2 115 S 0 0K 00:00:00 0.00% [kthreadd]
以上信息会每隔5秒刷新一次。
· 输入“h”或“?”,将显示如下帮助信息。
Help for interactive commands:
?,h Show the available interactive commands
1 Toggle SMP view: '1' single/separate states
c Sort by the CPU field(default)
d Set the delay interval between screen updates
f Sort by number of open files
k Kill a job
l Refresh the screen
m Sort by memory used
n Set the maximum number of processes to display
q Quit the interactive display
t Sort by run time of processes since last restart
< Move sort field to the next left column
> Move sort field to the next right column
Press any key to continue
· 输入“d”后,根据出现的提示如果输入“3”,则统计信息将会每隔3秒更新一次。
Enter the delay interval between updates(1~2147483647):3
· 输入“n”后,根据出现的提示如果输入“5”,则显示的进程数目将会变为5个。
Enter the max number of procs to display(0 is unlimited):5
87 processes; 113 threads; 735 fds
Thread states: 2 running, 111 sleeping, 0 stopped, 0 zombie
CPU states: 86.57% idle, 0.83% user, 11.74% kernel, 0.83% interrupt
Memory: 755M total, 414M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
864 864 120 S 24 27020K 00:00:43 8.95% syslogd
1173 1173 120 R 24 2664K 00:00:01 2.37% top
866 866 120 S 18 10276K 00:00:09 0.69% devd
1 1 120 S 16 1968K 00:00:04 0.41% scmd
881 881 120 S 8 2420K 00:00:07 0.41% diagd
· 输入“f”,统计信息将以打开的文件句柄数降序输出(c、m、t命令字类似)。
87 processes; 113 threads; 735 fds
Thread states: 1 running, 112 sleeping, 0 stopped, 0 zombie
CPU states: 90.66% idle, 0.88% user, 5.77% kernel, 2.66% interrupt
Memory: 755M total, 414M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
862 862 120 S 61 5384K 00:00:01 0.00% dbmd
905 905 120 S 35 2464K 00:00:02 0.00% ipbased
863 863 120 S 31 1956K 00:00:00 0.00% had
884 884 120 S 31 30600K 00:00:00 0.00% lsmd
889 889 120 S 29 61592K 00:00:00 0.00% routed
· 输入“k”后,根据出现的提示如果输入884,将会终止此JID对应的任务“lsmd”。
84 processes; 107 threads; 683 fds
Thread states: 1 running, 106 sleeping, 0 stopped, 0 zombie
CPU states: 59.03% idle, 1.92% user, 37.88% kernel, 1.15% interrupt
Memory: 755M total, 419M available, page size 4K
JID PID PRI State FDs MEM HH:MM:SS CPU Name
862 862 120 S 56 5384K 00:00:01 0.00% dbmd
905 905 120 S 35 2464K 00:00:02 0.00% ipbased
863 863 120 S 30 1956K 00:00:00 0.00% had
889 889 120 S 29 61592K 00:00:00 0.00% routed
1160 1160 120 S 28 23096K 00:00:01 0.19% sshd
· 输入“q”,将退出交互模式。
表1-14 monitor process命令显示信息描述表
线程状态:处于running状态的线程数,处于sleeping(包括interruptible sleep和uninterruptible sleep)状态的线程数,处于stopped状态的线程数,处于zombie状态的线程数 |
|
CPU状态:空闲率,用户态占用率,内核态占用率,中断占用率 |
|
内存状态:总量,可用内存数,page大小,单位为KB |
|
· R:running,运行状态或处于运行队列 · S:sleeping,可中断睡眠状态 · T:traced or stopped,暂停状态 · D:uninterruptible sleep,不可中断睡眠状态 · Z:zombie,僵死状态 |
|
file descriptions,进程打开的文件句柄数 |
|
进程CPU使用率 |
|
进程名称(如果进程名称带有“[ ]”标记,则表示该进程为内核线程) |
monitor thread命令用来显示线程的统计信息。
monitor thread [ dumbtty ] [ iteration number ] [ slot slot-number [ cpu cpu-number ] ]
dumbtty:以哑终端方式显示线程统计信息(即屏幕不支持定时刷新统计信息)。指定该参数时,全部线程的统计信息以CPU使用率降序排列输出到屏幕上。不指定该参数时,统计信息以交互模式显示,缺省情况下按CPU占用率降序显示前10个线程的统计信息,且每隔5秒更新一次。
iteration number:进程统计信息的显示次数,取值范围为1~4294967295。指定dumbtty参数时number的缺省值为1;不指定dumbtty且不配置number参数时,表示显示次数没有限制,统计信息会一直显示。
slot slot-number:表示设备在IRF中的成员编号,不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
不指定dumbtty参数的情况下,统计信息以交互模式显示。
· 交互模式下,系统会自动计算可显示的线程个数,超过屏幕范围的不作显示。
· 交互模式下,用户可通过输入表1-15中指定的交互命令字来执行相应的操作。
表1-15 monitor thread命令支持的交互命令字描述表
?或h |
|
改变显示的线程个数,取值为0~2147483647(缺省值为10个,0表示不作限制);超过屏幕范围时,仍只显示一屏内可容纳的线程个数 |
|
# 以哑终端方式显示线程统计信息。
<Sysname> monitor thread dumbtty
84 processes; 107 threads
Thread states: 1 running, 106 sleeping, 0 stopped, 0 zombie
CPU states: 83.19% idle, 1.68% user, 10.08% kernel, 5.04% interrupt
Memory: 755M total, 417M available, page size 4K
JID TID LAST_CPU PRI State HH:MM:SS MAX CPU Name
1175 1175 0 120 R 00:00:00 1 10.75% top
1 1 0 120 S 00:00:06 1 2.68% scmd
881 881 0 120 S 00:00:09 1 2.01% diagd
776 776 0 120 S 00:00:01 0 0.67% [DEVD]
866 866 0 120 S 00:00:11 1 0.67% devd
2 2 0 115 S 00:00:00 0 0.00% [kthreadd]
3 3 0 115 S 00:00:01 0 0.00% [ksoftirqd/0]
4 4 0 99 S 00:00:00 1 0.00% [watchdog/0]
5 5 0 115 S 00:00:00 0 0.00% [events/0]
6 6 0 115 S 00:00:00 0 0.00% [khelper]
796 796 0 115 S 00:00:00 0 0.00% [kip6fs/1]
<Sysname>
# 以交互模式显示线程统计信息。
84 processes; 107 threads
Thread states: 1 running, 106 sleeping, 0 stopped, 0 zombie
CPU states: 94.43% idle, 0.76% user, 3.64% kernel, 1.15% interrupt
Memory: 755M total, 417M available, page size 4K
JID TID LAST_CPU PRI State HH:MM:SS MAX CPU Name
1176 1176 0 120 R 00:00:01 1 3.42% top
866 866 0 120 S 00:00:12 1 0.85% devd
881 881 0 120 S 00:00:09 1 0.64% diagd
1 1 0 120 S 00:00:06 1 0.42% scmd
1160 1160 0 120 S 00:00:01 1 0.21% sshd
2 2 0 115 S 00:00:00 0 0.00% [kthreadd]
3 3 0 115 S 00:00:01 0 0.00% [ksoftirqd/0]
4 4 0 99 S 00:00:00 1 0.00% [watchdog/0]
5 5 0 115 S 00:00:00 0 0.00% [events/0]
6 6 0 115 S 00:00:00 0 0.00% [khelper]
· 输入“h”或“?”,帮助信息显示如下:
Help for interactive commands:
?,h Show the available interactive commands
c Sort by the CPU field(default)
d Set the delay interval between screen updates
k Kill a job
l Refresh the screen
n Set the maximum number of threads to display
q Quit the interactive display
t Sort by run time of threads since last restart
< Move sort field to the next left column
> Move sort field to the next right column
Press any key to continue
· 输入“d”后,根据出现的提示如果输入“3”,统计信息将会每隔3秒更新一次。
Enter the delay interval between screen updates(1~2147483647):3
· 输入“n”后,根据出现的提示如果输入“5”,显示的线程数目将会变为5个。
Enter the max number of threads to display(0 means unlimited):5
84 processes; 107 threads
Thread states: 1 running, 106 sleeping, 0 stopped, 0 zombie
CPU states: 93.26% idle, 0.99% user, 4.23% kernel, 1.49% interrupt
Memory: 755M total, 417M available, page size 4K
JID TID LAST_CPU PRI State HH:MM:SS MAX CPU Name
1176 1176 0 120 R 00:00:02 1 3.71% top
1 1 0 120 S 00:00:06 1 0.92% scmd
866 866 0 120 S 00:00:13 1 0.69% devd
881 881 0 120 S 00:00:10 1 0.69% diagd
720 720 0 115 D 00:00:01 0 0.23% [TMTH]
· 输入“k”后,根据出现的提示输入881,将会终止此JID对应的任务diagd。
83 processes; 106 threads
Thread states: 1 running, 105 sleeping, 0 stopped, 0 zombie
CPU states: 96.26% idle, 0.54% user, 2.63% kernel, 0.54% interrupt
Memory: 755M total, 418M available, page size 4K
JID TID LAST_CPU PRI State HH:MM:SS MAX CPU Name
1176 1176 0 120 R 00:00:04 1 1.86% top
866 866 0 120 S 00:00:14 1 0.87% devd
1 1 0 120 S 00:00:07 1 0.49% scmd
730 730 0 0 S 00:00:04 1 0.12% [DIBC]
762 762 0 120 S 00:00:22 1 0.12% [MNET]
· 输入“q”,将退出交互模式。
表1-16 monitor thread命令显示信息描述表
线程状态:处于running状态的线程数,处于sleeping(包括interruptible sleep和uninterruptible sleep)状态的线程数,处于stopped状态的线程数,处于zombie状态的线程数 |
|
CPU状态:空闲率,用户态占用率,内核态占用率,中断占用率 |
|
· R:running,运行状态或处于运行队列 · S:sleeping,可中断睡眠状态 · T:traced or stopped,暂停状态 · D:uninterruptible sleep,不可中断睡眠状态 · Z:zombie,僵死状态 |
|
线程单次调度占用CPU的最长时间,以毫秒为单位 |
|
线程CPU使用率 |
|
线程名称(如果线程名称带有“[ ]”标记,则表示该线程为内核线程) |
process core命令用来开启/关闭用户态进程异常时的生成core文件的功能,以及配置能生成的core文件的最大个数。
用户态进程在首次异常时会生成core文件,后续异常不再生成core文件。即maxcore的最大数值为1。
off:表示关闭用户态进程异常时生成core文件的功能。
maxcore value:表示开启用户态进程的core文件生成功能,并配置能生成的core文件的最大个数。value表示用户态进程能生成的core文件的最大个数,取值范围为1~10,缺省值为1。
name process-name:用户态进程的名称,为1~15个字符的字符串,不区分大小写。process core命令的配置对用户态进程下的所有实例有效。
job job-id:任务ID,用于唯一标识一个进程,该ID不会随着进程的重启而改变,取值范围为1~2147483647。
slot slot-number:表示设备在IRF中的成员编号,不指定表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
开启用户态进程的core文件生成功能,并配置能生成的core文件的最大个数后,用户态进程异常重启一次,就会产生一个core文件并记录用户态进程的异常信息。如果生成的core文件的数目达到最大值,则不再生成新的core文件。软件开发和维护人员能够根据core文件的内容来定位异常的原因和异常的位置。
# 关闭用户态进程routed的core文件生成功能。
<Sysname> process core off name routed
# 开启用户态进程routed的core文件生成功能,并且最多可生成5个core文件。
<Sysname> process core maxcore 5 name routed
· display exception context
reset exception context命令用来清除用户态进程异常时记录的上下文信息。
reset exception context [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 清除用户态进程异常记录。
<Sysname> reset exception context
reset kernel deadloop命令用来清除内核线程死循环信息。
reset kernel deadloop [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 清除内核线程死循环信息。
<Sysname> reset kernel deadloop
· display kernel deadloop
reset kernel exception命令用来清除内核线程的异常信息。
reset kernel exception [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 清除内核线程的异常信息。
<Sysname> reset kernel exception
· display kernel exception
reset kernel reboot命令用来清除内核线程重启信息。
reset kernel reboot [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 清除内核线程重启信息。
· display kernel reboot
reset kernel starvation命令用来清除内核线程饿死信息。
reset kernel starvation [ slot slot-number [ cpu cpu-number ] ]
slot slot-number:表示IRF中设备的成员编号。不指定该参数时,表示主设备。
cpu cpu-number:表示CPU编号。不指定该参数时,表示默认CPU。
# 清除内核线程饿死信息。
<Sysname> reset kernel starvation
· display kernel starvation
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!