使用 Microsoft System Center Operations Manager 2007 管理商務應用程式

技術解決方案簡要

Published:2007 年 3 月 19 日

How Microsoft Does IT

Microsoft® System Center Operations Manager 2007 為 Microsoft Information Technology (Microsoft IT) 群組提供了基礎,以提升操作效率和調整 IT 服務使之符合 Microsoft 的需求。Microsoft IT 藉由提供使用以新一代端對端服務管理解決方案為基礎對特定業務 (LOB) 應用程式更強的控制給業務單位以達成這些目標。

本頁內容

介紹
改進適用於 LOB 應用程式的服務等級
在 Microsoft 內的特定業務應用程式
福利註冊應用程式
分散式應用程式監控器
最佳實作
結論

LOB 應用程式是處於 Microsoft 內所有商務的核心。這些應用程式除了可促進與客戶、合作夥伴及廠商之間的協同作業和通訊之外,還可促進策略性規劃和內部商務程序。這些應用程式還可讓員工管理他們的事業與人力資源 (HR) 福利方案。現在共有超過 2,500 個 LOB 應用程式存在於企業生產環境中。對 Microsoft IT 而言。管理這些複雜和分散式應用程式是件重要的工作。

此技術解決方案可簡短說明 Microsoft IT 如何使用 System Center Operations Manager 2007 來開發適用於企業生產環境中之關鍵任務 LOB 應用程式的端對端服務管理解決方案。Microsoft IT 已在 2006 年 11 月使用此產品的 Release Candidate 1 版本進行試驗專案。

此技術解決方案簡報內附資訊可適用於負責評估 System Center Operations Manager 優點的 IT 決策者和負責規劃設計與實作端對端企業管理解決方案的應用程式設計人員與 IT 實作人員。本文假定對象已熟悉有關 Microsoft Windows Server® 2003、Active Directory® 目錄服務及 Microsoft Operations Manager (MOM) 2005 的概念。System Center Operations Manager 內附有關新功能與技術的高階說明也相當有用。可從 http://go.microsoft.com/fwlink/?LinkId=64017 取得詳細的產品資訊。

注意: 基於安全性的理由,在本文內所使用之內部資源、應用程式元件、服務及解決方案的範例名稱均不會用 Microsoft 內所用的實際名稱來表示,且這些名稱只是作為實例之用。此外,本文內容會描述 Microsoft IT 如何執行其企業資料中心。本文內所附的程序與處理程序並非硬性規定有關如何執行一般資料中心的指導,且也可能不會被 Microsoft 客戶支援服務所支援。

介紹

Microsoft IT 所維護的複雜企業環境是由 16 個資料中心、在 98 個國家內的 441 辦公室地區,以及超過 121,000 位使用者所組成。公司網路內包括了將近 350,000 部工作站和 11,000 個實際執行伺服器,儲存超過 1,000 TB 的資料。在此基礎結構的頂端存放著由 Microsoft IT 所維護用來支援公司內業務單位 (包括財務、HR、行銷、營運、採購及銷售) 的 2,500 個 LOB 應用程式。

維護如此大規模的環境是 Microsoft IT 內兩個主要部門的主要工作:

  • 基礎結構服務 (Infrastructure Services,IS)  維護與支援電話語音和網路基礎結構、伺服器作業系統、核心基礎結構服務 (例如 Domain Name System [DNS] 及 Active Directory)、全域訊息環境,以及監控基礎結構。共有超過 2,500 位 IT 專業人員工作於 IS 部門內,並根據技術服務加以分組。

  • 公司 IT (Business IT)  開發、維護及支援在企業生產環境內的 LOB 應用程式。例如:HR IT 群組是負責 HR 部門的 LOB 應用程式,而「商業 IT」(Commercial IT) 群組則是負責所有的銷售、行銷及產品支援應用程式。另有一個群組則負責提供對集中式企業資源規劃 (ERP) 系統的支援,此集中式企業資源規劃系統是 Microsoft 用於所有財務與供應鏈管理和用來儲存 HR 主要資料。Financial IT 群組是負責管理薪資和會計應用程式。公司 IT 群組一共包括超過 1,500 位 IT 專業人員。

圖 1 顯示 IS 和公司 IT 群組如何檢視企業生產環境。從不同的觀點來看,IS 所使用的監控工具著重於基礎結構方面;而公司 IT 群組則需要包括一般使用者觀點所監控的用戶端、伺服器、應用程式及綜合異動,以管理和改進端對端的 IT 服務傳遞。

圖 1。企業生產環境的 IS 和公司 IT 檢視

圖 1。企業生產環境的 IS 和公司 IT 檢視

改進適用於 LOB 應用程式的服務等級

Microsoft IT 可藉由使用 Microsoft Operations Manager (MOM) 2005 和有限數目的協力廠商解決方案,為關鍵商務基礎結構服務 (例如 Microsoft Exchange Server、Microsoft SharePoint® 產品與技術,以及Active Directory) 建立 99.99% 可用性。第一層級操作員會在使用者察覺問題之前發現所有基礎結構問題的 87%。在問題出現的兩分鐘之內約可偵測到所有警示的 98%。然而,根據內部支援統計顯示,使用者仍會發現大部份的應用程式問題,因此公司 IT 群組須負責回應。公司 IT 群組需有有效率的監控解決方案,支援超越 Microsoft Operations Manager (MOM) 2005 功能的主動式服務管理方法,以便在使用者發現問題之前能識別和解決會影響分散式 IT 服務健康狀況的問題。

為了移除防止 Microsoft IT 提升在 System Center Operations Manager 2007 之前的 LOB 應用程式空間內之服務等級的障礙,Microsoft IT 設計出了下列策略:

  1. 將獨立的監控環境合併在一個涵蓋完整企業生產環境的集中式 System Center Operations Manager 基礎結構內。

  2. 藉由使用 System Center Operations Manager 內所提供之新的製作和編輯工具,為標準和自訂的 LOB 應用程式開發節省成本的管理組件和端對端服務管理解決方案。

  3. 根據個別的控制領域委派監控責任給個別的 Microsoft IT 小組和群組,以便它們能將相關的健康狀況資訊片段整合到它們的操作處理程序中。

集中監控基礎結構

高度分散式 LOB 應用程式是由可共用一般資源的鬆散結合的元件所組成,有些已散佈到世界各地。為了能對這些類型的應用程式達到有效率的端對端服務管理,監控基礎結構須涵蓋整個企業生產環境,包括硬體裝置、Microsoft 產品、自訂 Microsoft IT 解決方案,以及非 Microsoft 的元件。任何在監控基礎結構內的缺口都代表著在端對端服務管理案例內的缺口。

下列的 System Center Operations Manager 功能可讓 Microsoft IT 用來建立集中式全域監控基礎結構:

  • 效能和延展性增強  支援高度可用性技術 (例如在 Windows Server 2003 內的 Windows® Clustering、以 Microsoft Systems Management Server (SMS) 套件為基礎的安全性增強與自動化的代理程式部署,以及根據 Active Directory 的自動化代理程式設定探索),可讓 Microsoft IT 有效率地部署 System Center Operations Manager。System Center Operations Manager 會自動探索新的系統與應用程式,並部署可用且適當的監控原則。在產品交付生產 (RTM) 的數個月之前,Microsoft IT 已使用 System Center Operations Manager 2007 Release Candidate 2 管理超過 20,000 台的電腦了。

  • 安全性增強   Active Directory 整合、以角色為基礎的授權,以及「執行身份」(Run As) 帳戶可讓 Microsoft IT 支援具有不同監控需求與安全性需求的個別小組和群組,而無須部署與維護多餘的管理伺服器和報告資料庫。

  • 簡易網路管理通訊協定 (SNMP)   直接支援 啟用 SNMP 的裝置藉由取代協力廠商解決方案提供降低成本的機會。它還可讓 Microsoft IT 將這些裝置隨附在提供給 LOB 應用程式的端對端服務管理解決方案內,以提供整個應用程式基礎結構的完整檢視給操作員。

  • Operations Manager Connector Framework  Microsoft IT 以 Operations Manager Connector Framework 為基礎將 System Center Operations Manager 與外部系統整合,例如作為事件管理用的 Helpdesk 票證系統;用來追蹤伺服器購買、組態及退休的組態管理資料庫 (CMDB);以及用來管理網路裝置的舊版協力廠商解決方案。雙向同步整合可經由 Operations Console 提供集中式企業管理。

注意: 在合併努力之後的直接成果為 Microsoft IT 建立了一個新的「企業監控」小組負責維護集中式監控基礎結構。

開發節省成本的端對端服務管理解決方案

System Center Operations Manager 內附超過 50 個管理組件,以提供以直接來自 Microsoft 作業系統、伺服器、用戶端及應用程式開發小組之最佳實作為基礎的規定性知識和自動化內嵌工作。此外 Microsoft IT 還匯入了由 Microsoft 合作夥伴所提供用來管理協力廠商商務解決方案的管理組件,例如集中式 ERP 系統和客戶關係管理系統。Microsoft IT 還使用 System Center Operations Manager 內所提供的轉換工具匯入先前為 LOB 應用程式所開發的自訂管理組件。這些管理組件擴充了 System Center Operations Manager 的監控功能,可涵蓋所有相關的 LOB 應用程式依存性。

System Center Operations Manager 除了具有改進的管理組件設計之外,還隨附了適用於一般服務的範本 (例如訊息與自訂的 Microsoft ASP.NET 應用程式) 及圖形化設計工具 (例如內嵌精靈),可用來建立新的自訂管理解決方案。相較於舊版的 Operations Manager,這些解決方案顯著地減少了開發的工作。可直接整合至 Operations Console 的自訂與製作診斷與規劃報告也是相當直接的處理程序。服務導向的檢視與報告可讓操作小組和 Microsoft IT 管理取得他們所需的資訊,以便能快速識別和解決會影響服務等級的問題。

Microsoft IT 使用 Windows Server、Microsoft SQL Server™、Microsoft .NET、Internet Information Services (IIS) 及其它技術作為建置組塊為 LOB 應用程式所建立的端對端服務管理解決方案包括:

  • 應用程式健康狀況模組  Microsoft IT 藉由使用在 Operations Console 內的 Distributed Application Designer,以範本和所發現的關係與元件類型為基礎,為分散式應用程式的基礎結構元件定義一個健康狀況模組,然後再建立管理這些元件所需的監控、規則、檢視及報告。此健康狀況模組會描述個別元件的狀態如何影響 LOB 應用程式的狀態。

  • 綜合異動  Microsoft IT 藉由使用在 Operations Console 內的 Web Application Editor,記錄一連串的使用者動作 (例如連線至網站和瀏覽網頁),然後再播放所記錄的動作以提供有關 LOB 應用程式如何執行的資訊。位在企業生產環境內任何地方的代理程式管理電腦可定期執行這些綜合異動以獲得一般使用者觀點的真正監控。這些綜合異動還可讓 Microsoft IT 對 LOB 應用程式進行壓力測試和觀察監控設定 (例如警示及通知) 是否如預期般地執行。

委派監控責任

Microsoft IT 藉由運用新功能 (例如透過 Active Directory 之以角色為基礎的授權) 以最低權限原則為基礎定義各種不同的存取層級來監控環境,以為工作的執行提供安全性。例如:System Center Operations Manager 支援各種不同的使用者角色,包括唯讀操作員、操作員及作者。Microsoft IT 使用這些使用者角色提供支援專員和群組管理員,根據他們的責任以監控解決方案的存取權如下:

  • 服務台和階層 1 支援  遇到有關 LOB 應用程式問題的使用者最先會連絡的是內部的服務台。服務台與階層 1 支援群組可提供與使用者介面有關之功能性疑問與問題相關的協助。這些支援群組具有唯讀操作員的權限,因此他們可使用 Operations Console 檢視相關的警示和檢查應用程式元件的健康狀況。這項資訊有助於呈報決定。

  • 階層 2 支援  服務台與階層 1 支援群組所無法解決的應用程式問題可呈報到在公司 IT 群組內的階層 2 支援工程師,負責處理受影響的 LOB 應用程式。此工程師必須在高度分散式 LOB 應用程式空間內,尋找並解決技術問題。因此,須指定「操作員」角色給階層 2 支援工程師,以便他們能與警示、執行工作及存取檢視互動,以識別在基礎結構內有問題的元件或瓶頸,並能快速解決問題。

  • 群組管理員  Microsoft IT 以「作者」角色為基礎提供個別的小組與群組對在監控基礎結構內資源之子集合的全面控制。在最初,來自「企業監控」小組內的系統管理員會對每個群組定義基本的監控資源與組態。然後具有製作權限的群組管理員便能在設定範圍內使用 Operations Console 來執行系統管理工作 (例如建立規則、通知資料流、監控及檢視),而無須依賴「企業監控」系統管理員。採用這種方式,業務單位便能獲得對服務管理功能更多的控制。

圖 2 顯示「企業監控」在一個合併的監控環境內如何使用以角色為基礎的授權來支援個別小組與群組,例如 HR IT 及「商業 IT」。

Figure 2. Role-based authorization in a centralized monitoring infrastructure

圖 2。在集中式監控基礎結構內以角色為基礎的授權

在 Microsoft 內的特定業務應用程式

Microsoft 每年花費超過五億美元在伺服器系統與 LOB 應用程式的併購、設計、開發、實作、支援及維護上。約有 20% 的 Microsoft IT LOB 應用程式為關鍵任務或作為做主管決策之用。

在為其它 LOB 應用程式建立核心基礎結構的解決方案之中,最重要的解決方案如下:

  • 電子郵件通知 Web 服務  這是個自動化系統,採用以動作為基礎和以時間為基礎的通知邏輯來通知使用者即將完成的工作。例如:如果使用者無法在商務規則所指定的期間內回覆電子郵件通知,「電子郵件通知」系統便會觸發提醒要求使用者採取行動。在專用 Web 服務內的集中式電子郵件通知處理可協助刪除 LOB 應用程式內重複的商務邏輯、減少與商務規則管理相關的負擔,以及產生更精簡且更穩定的應用程式程式碼。

  • 錯誤記錄 Web 服務  此服務可在企業生產環境內提供有關錯誤報告的集中式解決方案。結構式例外處理是所有 Microsoft IT LOB 應用程式中不可或缺的一部份。如果在 LOB 應用程式內發生例外狀況,則應用程式程式碼會產生「例外狀況」物件,並會以 XML 格式將偵錯資訊傳送到「錯誤記錄」(Error Logging) Web 服務報告已發生重要錯誤。

  • 以角色為基礎的權限 (Role-Based Permissions, RBP) 系統  此服務可經由從公司 ERP 系統複寫主要資料變更的自動化處理程序將適用於 LOB 應用程式的安全性與權限管理集中化。所有 Microsoft IT LOB 應用程式均支援以整合式 Windows 驗證為基礎的單一登入。大部分內部所開發的 LOB 應用程式也可依賴 RBP 協助確保只有具有適當角色的授權使用者才能存取敏感性資料,如個人的身分識別資訊。例如:HR 的 LOB 應用程式可能允許某位經理查看其直屬員工的社會安全號碼和薪資,而員工則只能查看他們自己的資料。目前 RBP 定義了約 14,000 位經理的角色。

  • 數位資產存放區  Microsoft IT 負責在一個名為「數位資產存放區」(Digital Asset Store) 的集中與加密式資料庫內管理個人的可識別資訊及其它高度敏感性資料。在 Microsoft IT 內的 Enterprise Data Services (EDS) 群組會以 Microsoft SQL Server 2005 為基礎來建立這個資料庫解決方案,將高度敏感性資料從 LOB 應用程式的空間內獨立出來。為了提供這項資訊給訂閱者,「數位資產存放區」須與 FeedStore 整合。

  • FeedStore  這是個 2 TB 的資料倉儲,可從 39 個內部來源取出資料 (包括公司的 ERP 系統及其它來自業務單位的主要資料庫),並可透過三個分佈伺服器提供資料給世界各地超過 500 個訂閱 LOB 應用程式。位在 Redmond、Dublin 及 Singapore 的分佈伺服器可藉由使用異動複寫提供 FeedStore 資料的子集合給訂閱者。EDS 群組負責開發與維護 FeedStore。

注意: Microsoft IT 負責追蹤在資料庫內的所有 LOB 應用程式,該資料庫具有關於每個應用程式的目的、變更狀態、產品發行版本,以及其它主要資料 (例如可用性和效能統計) 等資訊。

應用程式相互依存性

Microsoft IT 藉由重複使用跨大量其它 LOB 應用程式的核心服務,便能減少在企業生產環境內的資料重複、將敏感性資訊保留在加密的中央地區以維護機密性、減少與安全性及權限管理相關聯的負擔、跨 LOB 應用程式一致性地套用通用商務規則 (例如電子郵件通知邏輯),以及讓錯誤報告與錯誤處理更為順暢。然而,在分散式服務導向架構 (SOA) 內跨大量 LOB 應用程式重複使用通用元件的缺點為會增加在服務管理、維護及支援上的複雜度。

例如:複雜的 Microsoft IT LOB 應用程式可能需依賴 ASP.NET 來實作基本的商務邏輯、透過 Microsoft ADO.NET 使用各種不同的 SQL Server 2005 資料庫,以及耗用一些以簡單物件存取通訊協定 (SOAP) 與 XML 為基礎之獨立的 Web 服務以標準方式將資料從 ERP 系統或其它來源取出。由於資料通訊的同步特性,因此 LOB 應用程式現在除了須依靠 Web 服務的可用性與效能之外,還須依靠其自己元件的可用性與效能。LOB 應用程式還可使用以異動或訊息佇列系統為基礎的非同步通訊方法,例如 SQL Server 2005 Service Broker 或「訊息佇列」(亦即所謂的 MSMQ)。雖然非同步通訊即使在個別元件暫時不適用的情況下仍可讓分散式元件相互作用,但它還需在佇列系統的可用性與可靠性方面導入新的依存性。

福利註冊應用程式

「福利註冊」(Benefits Enrollment) 應用程式是個關鍵任務 LOB 應用程式,可將 SQL Server 資料庫、Web 服務,以及以「訊息佇列」為基礎的非同步通訊方法合併的範例。 HR IT 負責替在美國近 30,000 名的 Microsoft 員工維護此應用程式。每年在員工公開註冊的期間,U.S. 員工可在家庭或雇用狀態合法變更之後使用此關鍵任務 Web 應用程式來變更醫藥、牙醫、員工生活,以及長期殘障福利的涵蓋範圍。此公開註冊期間是從 11 月 1 日起至 11 月 30 日止。在這段期間內未提出變更的員工將自動繼續沿用他們目前的福利套件至下一年度。在日曆時間的提醒期間內,員工可使用此「福利註冊」應用程式來檢閱目前的福利資訊。

圖 3 所顯示的是「福利註冊」應用程式的架構。員工可透過 5 個前端 Web 伺服器之一來存取此以網站方式的解決方案,這 5 個前端 Web 伺服器是經由「網路負載平衡」(Network Load Balancing,NLB) 加以叢集以確保高度可用性與延展性。所需要的用戶端瀏覽器為 Windows Internet Explorer ®。在用戶端與伺服器之間需靠 Secure Sockets Layer (SSL)、超文字安全傳輸通訊協定 (HTTPS),以及提供網路安全性的信任連線進行通訊。Web 伺服器所執行的是 IIS 6.0 版,並主控此應用程式的 ASP.NET 網頁。此應用程式的資料庫是存在於以 Windows Clustering 為基礎的 SQL Server 2005 容錯移轉叢集上。另一個伺服器叢集主控兩個採用「主動/主動」組態的虛擬伺服器,執行核心 LOB 服務在 FeedStore 與電子郵件通知、RBP 及其它應用程式支援服務之間進行資料交換。在伺服器之間的通訊是經由技術的混合 (包括 ADO.NET、SOAP/XML 及「訊息佇列」等技術) 而產生。

圖 3。「福利註冊」應用程式的架構

圖 3。「福利註冊」應用程式的架構

分散式應用程式監控器

使用 System Center Operations Manager 2007 試驗提供給「福利註冊」應用程式的端對端服務管理解決方案,可讓 Microsoft IT 用來強調新的分散式操作處理程序。在這些處理程序中,Microsoft IT 可在一個合併的環境中運用以角色為基礎的授權的優點,從一般使用者觀點實作有效率的鬆散結合的 LOB 應用程式的監控。

分散式企業監控策略

在 Microsoft IT 內,個別的小組與群組可從提供關鍵商務服務的觀點來檢視他們的責任。如此一來可直接導向 Microsoft IT 的測量服務等級哲學:只讓伺服器能持續執行是不夠的。不應再專注於個別的伺服器狀態,而應重視傳遞服務給商務使用者所需的所有元件。

「企業監控」小組負責為所有 IT 群組維護全域監控基礎結構和健康狀況資訊,而個別群組則根據他們 LOB 應用程式的特定需求和操作處理程序使用特殊設計的監控工具來檢視這項資訊、建立報告及設定通知資料流。當 LOB 應用程式共用一般資源與元件時,個別端對端服務管理工具會重疊和依賴這項相同的健康狀況資訊,但卻不會重複基礎資料、管理代理程式,或管理伺服器。一個群組為了配合群組的特定需求所套用至監控解決方案的自訂 (例如自訂的警示) 並不會影響到包含相同資源與元件的其它群組之監控解決方案。

圖 4 所顯示的是個展示分散式企業監控原則的範例。EDS 群組負責維護被大量其它 LOB 應用程式所使用的 FeedStore 資料倉儲,例如 HR IT 群組所維護的「福利註冊」應用程式。EDS 操作員藉由使用端對端服務管理解決方案便可觀察關鍵任務 FeedStore 倉儲,以確保其可用性與效能。HR IT 操作員也可使用其它的監控解決方案來持續追蹤「福利註冊」應用程式。因為這是個端對端案例,因此 HR IT監控解決方案需涵蓋「福利註冊」應用程式所依存的所有元件,包括 FeedStore 在內。HR IT 並不負責維護 FeedStore,因為這對一般使用者而言是無關的。從一般使用者觀點的檢視,任何與「福利註冊」應用程式有關的端對端問題都屬於 HR IT 的管轄範圍,包括 FeedStore 及所有其它的核心服務與元件在內。

圖 4。在 Microsoft 內分散式 LOB 應用程式的端對端服務管理

圖 4。在 Microsoft 內分散式 LOB 應用程式的端對端服務管理

實作以 System Center Operations Manager 為基礎的分散式監控須具備下列提供給 Microsoft IT 的優點:

  • 在 Windows 技術上現有投資的重複使用  Microsoft IT 群組無須部署或維護多餘之 Active Directory、SQL Server 或監控基礎結構的情況下便能監控他們的特定 LOB 應用程式與元件。

  • 分散式 IT 服務的主動式端對端管理  可在 LOB 應用程式的監控解決方案內直接觀察到會影響 LOB 應用程式之可用性或效能的任何問題。操作員可快速地找出麻煩的焦點與瓶頸,無論麻煩是存在於應用程式本身內或在任何應用程式所依靠的裝置、系統及元件內。

  • 既豐富且新的報告和容易自訂的報告環境  診斷與規劃報告內含全面性的資訊及展現事件的真實原因。業務單位 (無論該業務單位是負責維護此 LOB 應用程式的群組或這是其它群組的責任) 可辨識問題的原因,並可洞悉問題提供疑難排解與規劃。

  • 提升服務等級  重疊監控解決方案可讓在 Microsoft IT 內的個別群組支援其它每個群組,以確保跨整個 IT 組織的最高服務等級。

福利註冊監控解決方案

為了建立根據 Microsoft IT 的分散式監控策略提供給「福利註冊」應用程式的監控解決方案,「企業監控」小組與 HR IT 群組密切地協同作業與執行下列以 Microsoft Solutions Framework (MSF) 內所概述之指導為基礎的步驟:

  1. 釐清業務需求與專案範圍  為了建立對所需監控解決方案的一般瞭解,「企業監控」須向 HR IT 群組示範 System Center Operations Manager 的功能。在做完此簡報之後和以「福利註冊」應用程式的架構為基礎,HR IT 與「企業監控」需定義適用於該監控解決方案試驗版本的範圍與交付項目。

  2. 規劃監控解決方案  在所定義的專案範圍內,「企業監控」與 HR IT 會分析員工如何使用「福利註冊」應用程式及在該應用程式的架構內的個別元件與依存性如何影響使用者。在其它的活動之中,這兩個小組會建立用來定義提供給「福利註冊」應用程式之健康狀況層級的基準。例如:如果回應時間超過 10 秒鐘,則應用程式的狀態會被認為是有問題的。

  3. 建立監控解決方案  「企業監控」小組可使用 System Center Operations Manager 內所提供的標準製作工具根據 HR IT 的規格建立監控解決方案的元件。「企業監控」小組會先在測試系統上開發解決方案,然後再在企業生產環境內手動重建該解決方案。重建監控解決方案需花費少於一個小時的工作。

  4. 穩定與部署監控解決方案  「企業監控」小組可依照在企業生產環境內的快速功能性檢查,藉由授予製作權限給負責「福利註冊」應用程式的產品經理提供解決方案給 HR IT。根據所定義的範圍,此步驟會完成提供給「企業監控」小組的專案。授予製作權限可讓 HR IT 更深入地自訂解決方案,例如定義通知資料流、通知、自訂檢視及報告。

注意: 位於 http://www.microsoft.com/technet/solutionaccelerators/msf/default.mspx (英文) 的 Microsoft TechNet 網站內提供了有關 MSF 的詳細資訊,包括 MSF Resource Kit 及案例研究。

釐清業務需求與專案範圍

經考量 Beta 問題與時間限制之後,「企業監控」與 HR IT 同意基本的、可靠的及有用的監控解決方案要比在員工公開註冊期間結束之後才推出的豪華版本更具有立即價值。「企業監控」可藉由專注於核心功能性迅速地推出基本解決方案,提供具有能以後續步驟套用自訂的鞏固基礎給 HR IT。

圖 5 所顯示的是「企業監控」與 HR IT 所遵循用來決定專案範圍的決策樹。首先,這兩個小組須先決定只包含實際的應用程式元素和核心服務在監控解決方案內。然後,這兩個小組須考慮適用於試驗版本的硬體、網路及基礎結構元素 (例如 Active Directory、DNS 及動態主機設定通訊協定 [DHCP]) 等次要因素,因為 Microsoft IT 須提供 99.99 可用性的保證在這些領域內。新增這些元件到監控解決方案內可提供非常詳細的應用程式基礎結構檢視給 HR IT,然而卻還需要 Microsoft IT 能將 System Center Operations Manager 2007 完整部署在企業生產環境內,這項工作並未對應到有關此產品 Release Candidate 1 版本的 Microsoft IT 計畫內。

圖 5。釐清有關「福利註冊」應用程式的監控範圍

圖 5。釐清有關「福利註冊」應用程式的監控範圍

「企業監控」與 HR IT 是以下列決策為基礎來定義專案範圍:

  • 包含元件  基本解決方案須監控負責主控應用程式、MSSQLDB 內之 HR 資料庫,以及在 MSMQCLUST01 與 MSMQCLUST02 上執行之核心服務的 Web 伺服器。(在本文稍早所提及的圖 3 內顯示了這些伺服器在「福利註冊」應用程式架構內的位置)。

  • 元件健康狀況監控  基本解決方案須包含一個分散式應用程式模組及健康狀況彙總組態,以便讓 HR IT 能監控每個應用程式元件的健康狀況。

  • 應用程式效能監控  基本解決方案須包含一個用來執行綜合異動的 Web 應用程式監控程式,以便讓 HR IT 能以實際一般使用者觀點為基礎追蹤「福利註冊」應用程式的可用性與回應時間。此 Web 應用程式監控程式須使用特殊的「執行身份」帳戶,因為 System Center Operations Manager 系統帳戶未被授權能存取 HR LOB 應用程式。

  • 以角色為基礎的授權  基本解決方案須只包含標準的檢視與報告。「企業監控」會授予有關通知資料流、通知及其它自訂的製作權限給 HR IT,以便讓 HR IT 在無須「企業監控」參與的情況下就能建立這些元素。

規劃監控解決方案

為了建立有效率的監控設計,「企業監控」與 HR IT 須分析在整體使用者經驗中個別應用程式元件的影響,特別是當使用「福利註冊」應用程式時員工如何能察覺元件失敗及效能瓶頸。例如:「福利註冊」應用程式是由在 NLB 叢集內的五個 Web 伺服器所主控 (正如本文稍早提及的圖 3 內所顯示的)。因為 NLB 叢集可提供自動容錯移轉功能,因此單一 Web 伺服器的無法使用並不會影響到使用者。其餘的 Web 伺服器仍適用,且具有充分的能力處理使用者要求而不影響效能。因此「企業監控」與 HR IT 決定只有當在 NLB 叢集內超過 50% 的伺服器無法使用時,才會出現嚴重錯誤情況。

表 1 節錄「企業監控」與 HR IT 為「福利註冊」應用程式所建立的主要監控準則。

表 1. 適用於「福利註冊」應用程式的監控計畫

類別

元件

監控準則

網站

WEB01、WEB02、WEB03、WEB04 和 WEB05

如果在 NLB 叢集內超過 50% 的伺服器無法使用,則健康狀況處於嚴重狀態。因為 NLB 叢集可提供自動容錯移轉功能,因此單一 Web 伺服器的無法使用並不能代表嚴重錯誤狀態。

HR 資料庫

MiscData、DataReplication、General、IssueTracking、Metadata 和 Payments

如果有任何的資料庫無法使用,則健康狀況處於嚴重狀態。

核心 LOB 服務

電子郵件通知、問題追蹤、RBP 和資料交換服務 (FeedStore)。

如果有任何的核心 LOB 無法使用,則健康狀況處於嚴重狀態。

Web 應用程式

反應時間

如果回應時間超過 10 秒鐘,則 健康狀況會達到警告層級,如果回應時間超過 20 秒鐘,則 健康狀況會達到嚴重錯誤層級。

使用者對效能的包容性約為每一網頁 20 秒的回應時間。

建立一個監控解決方案

為了根據試驗版本的範圍實作監控計畫,「企業監控」小組須使用 Operations Console 建立下列的元素:

  • 自訂管理組件  System Center Operations Manager 使用管理組件的概念儲存監控解決方案的規則與組態設定。「企業監控」以一個單一的自訂管理組件形式提供「福利註冊」監控解決方案給 HR IT。

  • 分散式應用程式模組  此應用程式模組是分散式應用程式的結構化呈現,以元件群組與群組關係的方式概述應用程式的組織。為了建立適用於「福利註冊」解決方案的應用程式模組,「企業監控」須直接使用 Operations Console 內所提供的 Distributed Application Designer。

  • 健康狀況彙總組態  在分散式應用程式模組內的每個元件群組均可提供存取健康狀況彙總設定。「企業監控」會根據「企業監控」與 HR IT 在規劃階段期間所建立的監控準則來規劃這些用來描述「福利註冊」應用程式動態行為的設定。

  • Web 應用程式監控程式  為了檢查可用性和測量「福利註冊」應用程式的回應時間,「企業監控」須建立 Web 應用程式監控程式。此監控程式可使用 HR IT 所提供的帳戶認證在已記錄的瀏覽器工作階段內執行綜合的超文字傳送協定 (HTTP) 要求。

建立分散式應用程式

「企業監控」可使用 Distributed Application Designer 及 Line of Business Web Application 範本建立適用於「福利註冊」解決方案的應用程式模組。此範本包含了提供給網站與資料庫的預先定義容器群組。除了預先定義的群組之外,「企業監控」還會建立提供給核心 LOB 服務的第三個容器,並建立在網站元件群組與應用程式服務元件群組之間的關係。因為核心 LOB 服務是在 Windows Clustering 虛擬伺服器上執行,因此「企業監控」會將新的元件群組限制屬於 Windows Cluster Resource 物件類別。接著,「企業監控」會使用 Distributed Application Designer 內的 Objects 窗格自動找出所有相關的物件,並藉由拖放操作至相對應的元件群組來新增這些物件。圖 6 所顯示的是應用程式模組的結果。

圖 6。「福利註冊」應用程式模組

圖 6。「福利註冊」應用程式模組

定義健康狀況彙總設定

表 2 節錄了「企業監控」套用於在分散式應用程式模組內之個別元件群組的健康狀況彙總組態。「企業監控」會根據本文稍早提及的 <規劃監控解決方案> 一節內所討論的監控計畫只設定最基本的參數。製作權限可讓 HR IT 小組以群組特定為基礎定義更進一步的設定。

表 2. 適用於「福利註冊」應用程式的健康狀況彙總組態

元件群組

參數

設定

有效值

「福利註冊」Web 應用程式網站

彙總演算法

在良好健康狀況中之成員的最差狀態百分比

顯示任何成員的最差狀態

 

百分比

50

 

「福利註冊」Web 應用程式資料庫

彙總演算法

任何成員的最差健康狀況

顯示任何成員的最差狀態

「福利註冊」Web 應用程式服務

彙總演算法

任何成員的最差健康狀況

顯示任何成員的最差狀態

建立一個 Web 應用程式監控程式

為了從一般使用者觀點測量「福利註冊」應用程式的可用性與效能,「企業監控」新增了一個 Web 應用程式監控程式物件到提供給 HR IT 的自訂管理組件內。在企業生產環境內的可管理電腦上執行的 System Center Operations Manager 代理程式會以定義在此監控物件內的組態設定為基礎執行綜合異動。執行應用程式監控程式的代理程式管理的電腦被稱之為監看員節點。為了追蹤跨企業生產環境全面性的可用性與效能,「企業監控」須選取位在所有 U.S. 地區的電腦作為監看員節點。

「企業監控」與 HR IT 須執行下列步驟來建立 Web 應用程式監控程式:

  1. 新增如「執行身份」帳戶般的 HR IT 系統帳戶至自訂管理組件內,以提供適用於 Web 應用程式監控程式的適當身分識別。

  2. 藉由使用 Add Monitoring Wizard 及 Web Application 管理組件範本在 Operations Console 內建立 Web 應用程式監控程式。在此設定步驟中,「企業監控」會從所有相關的地區中指定代理程式管理的電腦作為監看員節點。

  3. 記錄執行綜合異動的瀏覽器工作階段。這些異動是模擬一般的使用者動作,例如登入及瀏覽網頁。因為有法律的限制,所以「企業監控」與 HR IT 無法將 Web 應用程式監控程式設定成能在 HR 資料庫內的完成實際異動。

  4. 定義適用於 Web 應用程式監控程式有關警告與嚴重錯誤層級的內容符合與回應時間準則。

  5. 啟用 Windows 驗證及指定可存取網頁的 HR IT 帳戶。

部署監控解決方案

「企業監控」會在企業生產環境內依照解決方案的功能測試,使用在 Operations Console 內的 Create User Role Wizard 替 HR IT 建立獨立的「作者」、「操作員」及「唯讀操作員」等使用者角色。「企業監控」還會將製作範圍限制於在 HR IT 的自訂管理組件內所建立的資源。「作者」使用者角色可提供對「福利註冊」監控解決方案的全面控制給 HR IT。「操作員」使用者角色會根據權限設定範圍包含一組能與警示、執行工作及存取檢視互動的權限。「唯讀操作員」使用者角色可允許相對應的使用者檢視警示及存取檢視。

「企業監控」可指定使用者角色給安全性群組。指定給安全性群組而非給個別使用者帳戶可讓 HR IT 在無須「企業監控」系統管理員進一步參與的情況下藉由新增或移除 Active Directory 內的群組成員指定使用者角色。HR IT 可經由相對應的安全性群組,指定「作者」使用者角色給負責「福利註冊」應用程式的產品規劃經理、指定「操作員」使用者角色給階層 2 支援工程師,以及指定「唯讀操作員」使用者角色給階層 1 專員。

試驗專案檢閱

HR IT 群組在非常接近 2006 年的公開註冊期間內使用此解決方案來監控「福利註冊」應用程式,並建立每日效能與可用性報告。這些報告包含了一些同時連線、處理器時間、處理器佇列長度、可用的記憶體、每秒記憶體分頁切換,以及每台伺服器的可用磁碟空間。HR IT 可根據這些報告將統計結果告知 Microsoft IT 與 HR 部門內的關係人,統計結果顯示 100% 應用程式可用性與平均伺服器使用率為 4.42% (Web 伺服器)、13.04% (資料庫伺服器) 及 7.92% (報告伺服器)。「福利註冊」應用程式具有 26,687 位唯一造訪者儲存在 17,046 筆資料錄內。

「企業監控」與 HR IT 會在公開註冊期間結束之後檢閱試驗專案與節錄他們的發現事項如下:

  • 提升彈性至符合服務等級  端對端服務管理解決方案可提供對應用程式監控所有方面的全面彈性控制給 HR IT。這些方面會根據應用程式特定支援需求及服務台、階層 1 及階層 2 操作員的推廣包含綜合異動監控及通知資料流與報告的自訂。基本上,監控解決方案是以由 HR IT 所獨占擁有的方式呈現,但卻無基礎結構維護與系統管理的負擔。HR IT 可在無須「企業監控」系統管理員參與或輔助的情況下立即滿足業務單位的要求提供自訂可用性與效能報告。

  • 釐清各自的責任  HR IT 可經由高度自訂的監控與支援解決方案專注於滿足商務使用者的需求,而「企業監控」則專注於維護在企業生產環境內的集中式監控基礎結構。「企業監控」會逐漸專注於整體的企業監控,且有大量的小型應用程式支援小組 (每個小組包含四位或更少的 IT 專員) 會負責每一個別的 LOB 應用程式,快速地識別與解決會影響服務等級的問題。

  • 低開發成本  「企業監控」可使用 System Center Operations Manager Operations Console 中現有的標準工具與精靈來建立「福利註冊」監控解決方案的基礎版本。提供製作權限給 HR IT,擺脫「企業監控」須在最初解決方案部署時決定詳細的業務單位需求。

  • 快速部署  端對端服務管理解決方案不需要特定的監控環境。所有所需的資源均由中央提供。重複使用現有技術投資可消除為達報告目的所需的部署其它管理代理程式、伺服器或資料倉儲。部署端對端服務管理解決方案是委派適當的使用者角色給個別公司 IT 群組的一項主要工作。

最佳實作

一份定義明確的專案範圍與監控計畫、直覺式製作工具與精靈,以及對系統管理、製作及操作工作的清楚區隔,可讓 Microsoft IT 即時提供適用於「福利註冊」應用程式的端對端服務管理解決方案,以便能在 2006 年的公開註冊期間執行第一版的試驗專案。Microsoft IT 根據在試驗階段中所獲得的經驗開發出下列能用來規劃與部署以 System Center Operations Manager 2007 為基礎之端對端服務管理解決方案的最佳實作:

  • 集中監控基礎結構  Microsoft IT 可藉由在集中的基礎結構內監控整個企業生產環境,便能包含在端對端服務管理解決方案內會影響 LOB 應用程式之可用性與效能的所有元件,而無須複製基礎健康狀況資訊。將 System Center Operations Manager 標準化與重複使用現有的投資將有助於 Microsoft IT 降低成本。

  • 分散應用程式監控  Microsoft IT 可藉由提供由所指定之 LOB 應用程式所需的監控工具 (包含 LOB 應用程式所依存的所有元件在內) 給個別的公司 IT 群組,便能建立重疊監控環境,且個別小組會相互支援以確保跨整個 IT 組織的最高服務等級。

  • 專注於立即價值  Microsoft IT 可藉由提供基本、鞏固及有用的監控解決方案給具有最大商業價值的關鍵任務 LOB 應用程式,便能快速地在 LOB 應用程式空間內實現改進的服務等級。在後續步驟中,個別公司 IT 群組可根據特定的需求自訂其解決方案。

  • 分析應用程式行為與依存性  Microsoft IT 可藉由定義會反應在嚴重錯誤情況下之應用程式行為的明確監控計畫,便能確保端對端解決方案能有效率地監控相對應之 LOB 應用程式的可用性與效能。

  • 從所有相關的地區監控可用性與效能  Microsoft IT 可藉由使用綜合異動與在所有相關地區內作為監看員節點的代理程式管理的電腦,便能從使用 LOB 應用程式之所有員工的觀點來追蹤可用性與效能。

  • 使用 Windows 安全性群組提供以角色為基礎的授權   Microsoft IT 可藉由授予「作者」、「操作員」或其它權限給安全性群組而不授予權限給在 System Center Operations Manager 內的個別使用者帳戶,便能委派權限管理給負責 LOB 應用程式的個別小組。

  • 記載解決方案  Microsoft IT 可藉由使用在 Operations Console 內所提供的標準製作工具和一套概述將被監控之元件與健康狀況設定的基本文件,便能在必要時快速地重建監控解決方案。

結論

System Center Operations Manager 2007 提供基礎給 Microsoft IT,用來降低成本,並可在同一時間在企業生產環境內提升與 LOB 應用程式有關的服務等級。效能與延展性的改進及新功能 (例如以角色為基礎的授權) 可讓 Microsoft IT 藉由合併管理群組使得 IT 操作更為順暢。集中監控基礎結構可消除多餘的管理伺服器和報告資料庫。將所有健康狀況資訊合併在一個集中的監控基礎結構也是替負責在企業生產環境內維護 LOB 應用程式與其它系統之個別小組與群組開發端對端服務管理解決方案的基本工作。個別監控解決方案可重疊包含共用裝置、伺服器、元件及服務,而無須複製基礎健康狀況資料。

重複使用現有技術投資是 Microsoft IT 用來降低成本與操作負擔的一項主要元素。另一項元素是重複使用來自 Microsoft 作業系統、伺服器、用戶端及應用程式開發小組,以及透過管理組件來自協力廠商的知識與專長。還有另一項主要元素為 System Center Operations Manager 與 Helpdesk 票證及其它系統的整合,將例行工作自動化,以便提升 IT 操作的效率。而且 Microsoft IT 還會將多餘的系統管理工作 (例如在企業生產環境內管理代理程式的部署及新系統與應用程式的探索) 自動化。

System Center Operations Manager 可提供容易自訂與擴充的端對端服務管理。服務範本與直覺式設計工具 (例如在 Operations Console 內的 Distributed Application Designer 及 Add Monitoring Wizard) 可讓 Microsoft IT 能在較短的開發週期內建立端對端服務管理解決方案。該解決方案包含用來從一般使用者觀點測量應用程式可用性與效能的綜合異動監控。

實際使用監控解決方案的群組具有製作權限,可根據業務單位的特殊需求更進一步地自訂解決方案。例如:公司 IT 群組可自訂效能與可用性報告,讓業務單位能輕鬆存取到統計結果及用來顯示達成服務等級與應用程式效能的其它資訊。

新的服務導向檢視及可用性報告可讓 Microsoft IT 操作小組及管理取得他們用來識別與解決會影響到 IT 服務之端對端傳遞所需的資訊。System Center Operations Manager 可採用這種方式可讓 Microsoft IT 能將 IT 服務調整到完全符合公司的需求。

如需詳細資訊

要取得更多有關 Microsoft 產品和服務的資訊,在美國請洽詢 Microsoft 銷售資訊中心,電話是 (800) 426-9400。在加拿大的顧客,請洽詢 Microsoft 加拿大資源中心,電話是 (800) 563-9048 。其他不在美國 50 州以及加拿大境內的顧客,請與 Microsoft 當地子公司聯繫。若要透過網際網路存取資訊,請至:

http://www.microsoft.com

http://www.microsoft.com/technet/itshowcase


現況

Microsoft IT 使用 99.99% 用於基礎結構服務的可用性來建立服務等級協定。然而,需依賴元件與服務之間相互作用的 LOB 應用程式卻與基礎結構服務無直接的關係。因此追蹤這些分散式商務解決方案的可用性和效能是相當困難的工作。

解決方案

Microsoft IT 使用 System Center Operations Manager 2007 便能在集中監控基礎結構內實作新的端對端監控解決方案。此新的解決方案是 LOB 應用程式之主動式管理的基礎。

好處

  • 較低的操作成本

  • 增加服務等級

  • 商務與 IT 服務的調整

  • 增加員工的生產力


產品與技術

  • Microsoft Operations Manager 2005

  • Microsoft System Center Operations Manager 2007

  • Microsoft SQL Server 2005

  • Microsoft ADO.NET

  • Message Queuing


下載

Technical Solution Brief
1.24 MB
Microsoft Word 檔

PowerPoint Presentation
1.24 MB
Microsoft PowerPoint 檔

顯示: