h5885 v3 裝windows server 2012r2 物理機(jī)自動(dòng)重啟藍(lán)屏 8臺(tái)服務(wù)器hyper-v 集群
處理過程
從事件日志來看,機(jī)器近期有一次藍(lán)屏行為(2021/9/12 8:34),7月也有一次,比較舊了,也為0x50。但由于c盤下沒有足夠大的剩余空間,pagefile配置沒有成功,只有一個(gè)minidump,信息較少。
====dump 分析====
// bugcheck 為0x50,意為訪問到一個(gè)無效內(nèi)存地址,callstck解析信息量很少,看到有一個(gè)三方安全驅(qū)動(dòng)nxup_ext_a有相關(guān)動(dòng)作,且該驅(qū)動(dòng)版本也比較舊了,建議做升級操作。另外一份dump是7月份的,比較舊了,callstack與此類似,也沒有太多信息,涉及到的三方驅(qū)動(dòng)為fltsrv,版本為2017年,建議先對這兩個(gè)驅(qū)動(dòng)進(jìn)行升級,再做進(jìn)一步觀察。
dump info
============================================
dump name: 091221-57890-01.dmp
windows 8.1 kernel version 9600 mp (64 procs) free x64
product: server, suite: terminalserver singleuserts
built by: 9600.19678.amd64fre.winblue_ltsb_escrow.200330-1737
kernel base = 0xfffff801`e6c78000 psloadedmodulelist = 0xfffff801`e6f3d5f0
debug session time: sun sep 12 08:27:04.004 2021 (utc + 8:00)
system uptime: 53 days 23:47:30.527
。。。。。。。。。。
。。。。。
。。。
。。
。
硬件日志詳細(xì)分析如下:(收集到帶外日志的2臺(tái)均一致)
1.sel日志中記錄到9月22日有系統(tǒng)未知原因復(fù)位,復(fù)位前無硬件異常告警:
2.fdm日志為空,排除硬件存在uce等引發(fā)系統(tǒng)復(fù)位可能性:
3.操作日志無相關(guān)記錄,排除對設(shè)備進(jìn)行復(fù)位等操作引發(fā)系統(tǒng)復(fù)位可能性:
4.硬件日志未發(fā)現(xiàn)異常,微軟反饋的nxup的驅(qū)動(dòng)是多路徑的,建議找存儲(chǔ)的看看。fltsrv這個(gè)也不是華為硬件提供的驅(qū)動(dòng),建議找對應(yīng)驅(qū)動(dòng)廠家看看。
根據(jù)微軟反饋的分析結(jié)論,可能與以下驅(qū)動(dòng)模塊相關(guān),其中nxup_ext_a.sys這個(gè)驅(qū)動(dòng)是華為多路徑的,建議可以讓存儲(chǔ)那邊看看。
fltsrv.sys這個(gè)驅(qū)動(dòng)也不是服務(wù)器這邊提供的,建議客戶找到對應(yīng)的驅(qū)動(dòng)廠家看看。
建議:
1.升級驅(qū)動(dòng)nxup_ext_a.sys和fltsrv.sys 后,進(jìn)一步觀察。
2.由于minidump信息量過少,請參考如下步驟配置kernel dump(pagefile 為20g),等待下次藍(lán)屏發(fā)生:
以管理員身份打開命令提示符依次運(yùn)行如下命令:
reg add hklm/system/currentcontrolset/control/session manager/memory management /v pagingfiles /t reg_multi_sz /d c:/pagefile.sys 20480 20480 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v dumpfile /t reg_expand_sz /d c:/windows/memory.dmp /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v crashdumpenabled /t reg_dword /d 2 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v autoreboot /t reg_dword /d 1 /f
重啟服務(wù)器配置生效。
注:確保c盤剩余空間大于2倍pagingfile大小。
解決方案
硬件日志未發(fā)現(xiàn)異常,微軟反饋的nxup的驅(qū)動(dòng)是多路徑的,建議找存儲(chǔ)的看看。fltsrv這個(gè)也不是華為硬件提供的驅(qū)動(dòng),建議找對應(yīng)驅(qū)動(dòng)廠家看看。
根據(jù)微軟反饋的分析結(jié)論,可能與以下驅(qū)動(dòng)模塊相關(guān),其中nxup_ext_a.sys這個(gè)驅(qū)動(dòng)是華為多路徑的,建議可以讓存儲(chǔ)那邊看看。
fltsrv.sys這個(gè)驅(qū)動(dòng)也不是服務(wù)器這邊提供的,建議客戶找到對應(yīng)的驅(qū)動(dòng)廠家看看。
建議:
1.升級驅(qū)動(dòng)nxup_ext_a.sys和fltsrv.sys 后,進(jìn)一步觀察。
2.由于minidump信息量過少,請參考如下步驟配置kernel dump(pagefile 為20g),等待下次藍(lán)屏發(fā)生:
以管理員身份打開命令提示符依次運(yùn)行如下命令:
reg add hklm/system/currentcontrolset/control/session manager/memory management /v pagingfiles /t reg_multi_sz /d c:/pagefile.sys 20480 20480 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v dumpfile /t reg_expand_sz /d c:/windows/memory.dmp /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v crashdumpenabled /t reg_dword /d 2 /f
reg add hklm/system/currentcontrolset/control/crashcontrol /v autoreboot /t reg_dword /d 1 /f
重啟服務(wù)器配置生效。
注:確保c盤剩余空間大于2倍pagingfile大小。