本文為機器翻譯文章。如需檢視英文版,請選取 [原文] 核取方塊。您也可以將滑鼠指標移到文字上,即可在快顯視窗顯示英文原文。
譯文
原文

監視和維護 SharePoint Server 2013

 

適用版本:SharePoint Server 2013 Enterprise, SharePoint Server 2013 Standard

上次修改主題的時間:2015-03-09

摘要:了解如何監視和維護 SharePoint Server 2013。

本文討論 SharePoint Server 2013 伺服器陣列的監視和效能計數器。若要維護 SharePoint Server 2013 系統效能,則必須監視伺服器以找出潛在的瓶頸。在可以有效率地進行監視之前,您必須了解關鍵指標以得知是否需要注意伺服器陣列的特定部分,並知道如何解譯這些指標。如果您發現伺服器陣列作用於所定義的目標外部,則可以透過新增或移除硬體資源、變更拓撲或變更資料儲存方式來調整伺服器陣列。

本節資訊是要協助系統管理員手動設定效能計數器和其他設定。如需狀況監視以及使用 SharePoint 管理中心網站 介面的內建狀況監視工具進行疑難排解的詳細資訊,請閱讀下列文章:

閱讀本文之前,應先閱讀<SharePoint Server 2013 的容量管理及調整大小概觀>。

本文內容:

以下是可變更以在早期階段監視環境的設定清單,協助您決定是否需要任何變更。增加監視功能會影響使用資料庫所需的磁碟空間量。環境穩定且不再需要此詳細監視之後,可能會想要將下面的設定還原為其預設設定。

 

設定 附註

防止事件記錄檔濫記

停用

預設值為 [啟用]。予以停用,即可收集最多的監視資料。如果是一般作業,則應該予以啟用。

計時器工作排程

   

Microsoft SharePoint Foundation 流量資料匯入

5 分鐘

預設值為 [30 分鐘]。降低這項設定,會更頻繁地將資料匯入至使用資料庫,而且在進行疑難排解時特別有用。如果是一般作業,則應該是 30 分鐘。

診斷提供者

   

啟用所有診斷提供者

啟用

預設值為 [停用],但 [搜尋狀況監視 - 追蹤事件] 提供者除外。這些提供者會收集各種功能和連線的狀況資料。如果是一般作業,可能會還原為預設值。

設定 "job-diagnostics-performance-counter-wfe-provider" 和 "job-diagnostics-performance-counter-sql-provider" 排程間隔

1 分鐘

預設值為 [5 分鐘]。降低這項設定,會更頻繁地輪詢資料,而且在進行疑難排解時特別有用。如果是一般作業,則應該是 5 分鐘。

其他

   

啟用內容要求的堆疊追蹤

啟用

預設值為 [停用]。啟用這項設定,允許使用程序堆疊追蹤來診斷內容要求失敗。如果是一般作業,則應該予以停用。

啟用開發人員儀表板

啟用

預設值為 [停用]。啟用這項設定,允許使用開發人員儀表板來診斷慢速頁面或其他問題。如果是一般作業,而且不再需要盡快進行疑難排解,則應該予以停用。

使用資料收集

   

內容匯入使用狀況

內容匯出使用狀況

頁面要求

功能使用

搜尋查詢使用情況

網站庫存使用狀況

計時器工作

分級使用量

啟用

啟用這組計數器的記錄,可讓您跨環境收集更多使用資料,更深入了解環境中的流量模式。

如果您是使用使用資料庫,則可以新增效能計數器,協助您監視和評估伺服器陣列對使用資料庫的效能,這樣一來,會以特定間隔自動記錄效能計數器 (預設為 30 分鐘)。如果,您可以查詢使用資料庫來擷取這些計數器,並繪出一段時間之結果的圖形。以下是如何使用 Add-SPDiagnosticsPerformanceCounter PowerShell Cmdlet,將 % Processor Time 計數器新增至使用資料庫。這只需要在一個網頁伺服器上執行:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

針對任何伺服器系統,都應該監視數個一般效能計數器。下表概述這些效能計數器。

 

效能計數器 說明

Processor

您應該監視處理器效能,確保所有處理器使用情況不是都一樣高 (超過 80%),因為這表示系統無法處理突然的大量活動。而在一般狀況下,如果一個元件故障而導致其餘元件失去作用,則看不到骨牌效應。例如,如果您有三部網頁伺服器,則應該確定所有伺服器的平均 CPU 低於 60%,這樣一來,如果其中一部故障,則還有空間,讓其他兩部吸收其他負載。

Network Interface

監視透過網路介面卡傳送和接收資料的速率。這應該低於網路容量的 50%。

Disks 和 Cache

您應該定期監視數個邏輯磁碟選項。在所有容量研究中,可用磁碟空間都十分重要,但是您也應該檢閱磁碟的閒置時間。根據伺服器上執行的應用程式或服務類型,可能會檢閱磁碟讀取和寫入時間。寫入或讀取函數的延伸佇列會影響效能。快取主要會影響讀取和寫入作業。您必須監視快取失敗是否增加。

Memory 和 Paging File

監視可用於配置的實體記憶體量。記憶體不足就會導致過度使用分頁檔,並增加每秒分頁錯誤數。

下表提供可新增至使用資料庫中所監視的這組計數器的系統物件和計數器資訊,而這組計數器是在網頁伺服器上使用 SPDiagnosticPerformanceCounter 進行監視。

 

物件和計數器 說明

Processor

 

% Processor Time

這會顯示一段時間的處理器使用情況。如果這持續居高不下,則可能會發現效能嚴重受到影響。在多處理器系統中,請一定要計算 "Total"。您也可以測量每個處理器的使用率,確保核心之間的效能平衡。

Disk

 

- Avg. Disk Queue Length

這會顯示在範例間隔期間針對所選取磁碟排入佇列的平均讀取和寫入要求數目。只要磁碟讀取/寫入沒有困難,而且系統在未展開佇列的情況下穩定運作,較大的磁碟佇列長度可能就不會造成問題。

Avg. Disk Read Queue Length

排入佇列的平均讀取要求數目。

Avg. Disk Write Queue Length

排入佇列的平均寫入要求數目。

Disk Reads/sec

每秒讀取到磁碟的次數。

Disk Writes/sec

每秒寫入至磁碟的次數。

Memory

 

- Available Mbytes

這會顯示可用於配置的實體記憶體量。記憶體不足就會導致過度使用分頁檔,並增加每秒分頁錯誤數。

- Cache Faults/sec

此計數器顯示在檔案系統快取中看得到但找不到分頁時發生錯誤的速率。這可能是軟容錯 (在記憶體中找到分頁時) 或硬錯誤 (分頁位於磁碟時)。

有效地使用讀取和寫入作業快取,會對伺服器效能造成重大影響。您必須監視提高的快取失敗,以 Async Fast Reads/secRead Aheads/sec 的降低來表示。

- Pages/sec

此計數器會顯示從磁碟讀取或寫入至磁碟之頁面的速率,以解決硬分頁錯誤。如果此值增加,則指出是全伺服器效能問題。

Paging File

 

- % Used 和 % Used Peak

伺服器分頁檔 (也稱為交換檔) 會將「虛擬」記憶體位址保留在磁碟上。如果程序必須停止並等待將必要「虛擬」資源從磁碟擷取至記憶體,則會發生分頁錯誤。如果實體記憶體不足,則這些項目會更為頻繁。

NIC

 

- Total Bytes/sec

這是透過網路介面卡傳送和接收資料的速率。如果此速度高於 40%-50% 的網路容量,則可能需要進一步調查。若要微調調查,請監視 Bytes received/secBytes Sent/sec

Process

 

- Working Set

此計數器指出給定程序之工作集的目前大小 (位元組)。此記憶體保留供這個程序使用,即使目前未使用也是一樣。

- % Processor Time

此計數器指出給定程序所使用的處理器時間百分比。

Thread Count (_Total)

目前執行緒數目。

ASP.NET

 

Requests Total

啟動服務之後的要求總數。

Requests Queued

SharePoint Foundation 2013 提供建置組塊,供透過 HTTP 在使用者瀏覽器中呈現的 HTML 頁面使用。此計數器顯示等待處理的要求數目。

Request Wait Time

佇列中最新要求等待處理的毫秒數。等待事件數增加時,使用者會體驗到分頁呈現效能下降。

Requests Rejected

因處理要求的伺服器資源不足而未執行的要求總數。此計數器代表傳回 503 HTTP 狀態碼 (指出伺服器太忙碌) 的要求數目。

Requests Executing (_Total)

目前正在執行的要求數目。

Requests/Sec (_Total)

每秒執行的要求數目。這代表應用程式的目前輸送量。在正常負載下,此數字應該保留在特定範圍,但其他伺服器工作 (例如廢棄項目收集、快取清理執行緒、外部伺服器工具等) 除外。

.NET CLR Memory

 

# Gen 0 Collections

顯示應用程式啟動之後,廢棄項目收集回收第 0 代物件 (即最新且最近配置的物件) 的次數。此數字在 #Gen 0: #Gen 1: #Gen 2 的比率時有用,確定 Gen 2 收集次數不會遠大於 Gen 0 收集次數,最佳是係數 2。

# Gen 1 Collections

顯示應用程式啟動之後,廢棄項目收集回收第 1 代物件的次數。

# Gen 2 Collections

顯示應用程式啟動之後,廢棄項目收集回收第 2 代物件的次數。此計數器會在第 2 代廢棄項目收集 (也稱為完整廢棄項目收集) 結束時遞增。

% Time in GC

顯示最後一個廢棄項目收集週期之後,執行廢棄項目收集所需的經過時間百分比。此計數器通常指出廢棄項目收集器代表應用程式收集和壓縮記憶體所完成的工作。只在每次廢棄項目收集結束時才會更新此計數器。此計數器不是平均值。它的值會反映最後一個觀察到的值。在一般作業中,此計數器應該低於 5%。

下表提供 SQL Server 物件和計數器的相關資訊。

 

物件和計數器 說明

General Statistics

此物件提供計數器,用以監視一般全伺服器活動,例如目前連線數目,以及每秒從執行 SQL Server 執行個體的電腦上連線及中斷連線的使用者數目。

User Connections

此計數器顯示 SQL Server 執行個體上的使用者連線數目。如果您看到這個數字增加 500% 的比較基準成本,則可能會看到效能降低。

Databases

此物件提供的計數器可監視大量複製作業、備份與還原輸送量以及交易記錄活動。監視交易與交易記錄,可判斷資料庫中發生了多少使用者活動,以及交易記錄的滿溢程度。使用者活動的數量可決定資料庫的效能,並且可能影響記錄大小、鎖定與複寫。監視低層級記錄活動以測量使用者活動與資源使用量,可協助您找出效能瓶頸。

Transactions/sec

此計數器顯示給定資料庫或整個 SQL Server 執行個體上每秒的交易數目。此數目可協助您建立基準,並可協助您進行問題疑難排解。

Locks

此物件提供個別資源類型上 SQL Server 鎖定的相關資訊。

Number of Deadlocks/sec

此計數器顯示 SQL Server 上每秒的死結數目。這一般應該為 0。

Average Wait Time (ms)

此計數器顯示每個導致等候狀況之鎖定要求的平均等候時間。

Lock Wait Time (ms)

此計數器顯示上一秒之鎖定的總等候時間。

Lock Waits/sec

此計數器顯示每秒無法立即獲得應允而必須等候資源的鎖定數目。

Latches

此物件提供計數器,用以監視稱為閂鎖的內部 SQL Server 資源鎖定。監視閂鎖以判斷使用者活動與資源使用情況,可協助您找出效能瓶頸。

Average Latch Wait Time (ms)

此計數器顯示必須等候之閂鎖要求的平均閂鎖等候時間。

Latch Waits/sec

此計數器顯示每秒無法立即獲得應允的閂鎖要求數目。

SQL Statistics

此物件提供計數器,用以監視編譯以及傳送至 SQL Server 執行個體的要求類型。監視查詢的編譯與重新編譯數目以及 SQL Server 執行個體所接收的批次數目,可讓您了解 SQL Server 處理使用者查詢的速度以及查詢最佳化工具處理查詢的效率。

SQL Compilations/sec

此計數器指出每秒輸入編譯代碼路徑的次數。

SQL Re-Compilations/sec

此計數器指出每秒觸發陳述式重新編譯的次數。

Plan Cache

此物件提供計數器,用以監視 SQL Server 如何使用記憶體來儲存各種物件 (例如預存程序、未備妥與已備妥的 Transact-SQL 陳述式與觸發程序)。

Cache Hit Ratio

此計數器指出計劃的快取點擊與查閱之間的比率。

Buffer Cache

此物件提供計數器,用以監視 SQL Server 如何使用記憶體來儲存資料頁面、內部資料結構與程序快取,另外也有計數器可監視 SQL Server 讀取及寫入資料庫頁面時的實體 I/O。

Buffer Cache Hit Ratio

此計數器顯示在緩衝區快取中找到分頁而不需要從磁碟讀取分頁的百分比。此比率是快取點擊總數除以 SQL Server 執行個體啟動之後的快取查閱總數所得出。

系統瓶頸代表資源不足無法服務使用者交易要求的競爭點。這可能是實體硬體、作業環境或應用程式型瓶頸。瓶頸的原因通常都是自訂程式碼或協力廠商解決方案不足,因此檢閱這些項目所產生的結果會優於新增硬體。另一個常見瓶頸原因是錯誤地設定伺服器陣列,或以所需資源高於必要資源的方式來建構資料的解決方案實作不足。系統管理員應該持續地監視效能來管理瓶頸。找出效能問題時,您必須評估最適合用來移除瓶頸的解決方法。效能計數器和其他效能監視應用程式 (例如 System Center 2012 - Operations Manager (SCOM)) 是重要的工具,可讓您透過追蹤和分析問題,開發出解決方案。

實體瓶頸是根據處理器、磁碟、記憶體和網路競爭而來:太多的要求在競爭太少的實體資源。<監視效能>主題中所述的物件和計數器會指出效能問題所在位置 (例如硬體處理器或 ASP.NET)。瓶頸解決方法需要您找出問題,然後進行變更以減輕效能問題。

問題很少會持續發生;如果您使用效能監視工具或更精密的系統 (例如 SCOM) 定期進行監視,則通常會追蹤到效能逐漸下降。針對這兩個選項 (程度不同),您可以在警示中透過建議文字或指令碼命令形式來內嵌解決方案。

您可能需要變更硬體或系統組態來解決瓶頸問題,前提是您判定瓶頸問題不是由錯誤設定、自訂程式碼或協力廠商解決方案不足或者解決方案實作不足所導致。下表識別問題閾值和可能解決方法選項。部分選項會建議進行硬體升級或修改。

 

物件和計數器 問題 解決方法選項s

Processor

Processor - % Processor Time

超過 75-85%

升級處理器

增加處理器數目

新增其他伺服器

Disk

   

Avg. Disk Queue Length

逐漸增加,系統不穩定而且正在備份佇列

增加磁碟數目或速度

變更要設為等量的陣列組態

將部分資料移到替代伺服器

% Idle Time

小於 90%

增加磁碟數目

將資料移到替代磁碟或伺服器

% Free Space

小於 30%

增加磁碟數目

將資料移到替代磁碟或伺服器

Memory

   

Available Mbytes

網頁伺服器上小於 2GB。

新增記憶體。

注意事項 附註:
根據設計,SQL Server 可用記憶體會不足,而且不一定指出發生問題。

Cache Faults/sec

大於 1

新增記憶體

如果可能,請增加快取速度或大小

將資料移到替代磁碟或伺服器

Pages/sec

大於 10

新增記憶體

Paging File

   

% Used 和 % Used Peak

伺服器分頁檔 (有時稱為交換檔) 會將「虛擬」記憶體位址保留在磁碟上。如果程序必須停止並等待將必要「虛擬」資源從磁碟擷取至記憶體,則會發生分頁錯誤。如果實體記憶體不足,則這些項目會更為頻繁。

新增記憶體

NIC

   

Total Bytes/sec

超過 40-50% 的網路容量。這是透過網路介面卡傳送和接收資料的速率。

監視 Bytes received/sec 和 Bytes Sent/sec,以進行進一步調查。

重新評估網路介面卡速度

檢查記憶體緩衝區的數目、大小和使用情況

Process

   

Working Set

大於 80% 的總記憶體

新增記憶體

% Processor Time

超過 75-85%。

增加處理器數目

將工作負載轉散發至其他伺服器

ASP.NET

   

應用程式集區回收

每天會有數次,導致間歇性緩慢。

請確定您尚未實作不需要在一天內自動回收應用程式集區的設定。

Requests Queued

已排入佇列的數百或數千個要求。

實作其他網頁伺服器

此計數器的預設上限是 5,000,而且您可以在 Machine.config 檔案中變更此設定

Request Wait Time

等待事件數增加時,使用者會體驗到分頁呈現效能下降。

實作其他網頁伺服器

Requests Rejected

大於 0

實作其他網頁伺服器

https://technet.microsoft.com/zh-tw/library/ee681489.aspx
顯示: