Formát pro tisk      Odeslat     
Po klepnutí budete moci zaslat hodnocení a názor
TechNet
TechNet Library
Průvodce výběrem storage řešení pro platformu Windows HPC Server 2008

Autor: Michal Kvasnička, Sprinx Systems,a.s.

Počítačové clustery se různí v závislosti na našich požadavcích na jejich schopnosti, výkon, případně i velikost. S tím úzce souvisí také nároky kladené na storage řešení a způsobu jeho administrace. V tomto článku si shrneme základní přehled storage produktů pro clustery založené na platformě Windows HPC Server 2008.

Špatně zvolené řešení datové základny může mít pro celkovou použitelnost clusteru velmi vážné důsledky. Pomalý přenos dat, nedostatečná kapacita, špatný přístup k datům, nedostačující odolnost vůči výpadkům a v neposlední řadě i nekompatibilita patří mezi nejčastější problémy s tím spojené. Při výběru storage řešení se proto ohlížíme zejména na následující aspekty:

1. Výkon

Tradiční superpočítače v rámci běžného použití obvykle pracují s přenosovou rychlostí připadající na jedno výpočetní jádro kolem 100 MB/s (při omezeném počtu těchto jader) nebo 50 MB/s (u systémů využívajících až několik set uzlů). Pokud není hardware schopen této přenosové rychlosti dosáhnout, proces datového přenosu a něm závislé aplikace běží zbytečně pomaleji než je teoreticky možné. V opačném případě, tj. při výrazně nadprůměrném výkonu, resp. přenosové kapacitě storage řešení, však vyhráno také nemáme, protože jádro nebo aplikace nemusí být schopna větší množství dat v daném čase odeslat, resp. přijmout. K optimálnímu zabezpečení požadavků na přenosovou rychlost je třeba zohlednit velikost clusteru a množství aplikačních procesů, které mohou běžet současně. Pro příklad - cluster složený ze 100 čtyřjádrových uzlů při datovém toku 50 MB/s na jádro vyžaduje souhrnnou přenosovou kapacitu ve výši 20 GB za sekundu (za předpokladu plného vytížení). Z toho plyne potřeba, aby storage řešení bylo schopno této rychlosti dosáhnout.

2. Kapacita

Jakmile jsou definovány výkonnostní parametry, je třeba určit čas, po který mají být data zpřístupněna online, a objem datového úložiště, který k tomu potřebujete. Z toho se odvíjejí požadavky na kapacitu storage řešení.

3. Přístupnost

Dalším důležitým aspektem je přístup k datovému úložišti. Ne všechny výpočetní uzly nutně potřebují přístup k celému datovému skladu, například proto, že neprovozují aplikace, které s ním pracují. Požadavky na přístupnost jsou tudíž odvozené od způsobu, jakým způsobem pracují aplikace provozované clusterem. V případě, že kterékoliv aplikace mohou běžet na kterémkoliv výpočetním uzlu, potom je nezbytné, aby všechny uzly měly přístup k celému storage prostoru.

4. Jednotný jmenný prostor

S jednotným jmenným prostorem (namespace) mají všechny uzly přístup k veškerým datům v témže okamžiku. V některých případech je tato možnost přímo nezbytná. NAS řešení (Network-attached storage), jako je Windows Storage Server (WSS) a produkty dalších výrobců, sdílené SAN sítě (storage area networks) za paralelními NAS branami, ale i paralelní úložné systémy jednotný jmenný prostor mají. WSS navíc umožňuje sdílení jednotného jmenného prostoru napříč vícero WSS systémy - což se nazývá Distributed File System Namespace (DFSN). DFSN přináší jednoduchý management většího počtu storage serverů, sdílení zátěže a automatizované "failover" funkce umožňující okamžité přepnutí na záložní systém v případě selhání.

5. Dostupnost

Je třeba se zamyslet také nad tím, jakým způsobem bude celý storage systém dostupný pro cluster. Požadavky na dostupnost lze řešit na úrovni serveru (vysoce dostupné NAS brány), storage (JBOD nebo RAID), storage řadiče (failover nebo LUN) a path (multipath failover, redundantní switche). K dispozici je velké množství variant pro řešení dostupnosti storage.

Zhodnocení potřeb zákazníka v uvedených pěti aspektech je výchozím krokem při volbě optimálního storage řešení pro cluster. Následující text pojednává o dostupných storage produktech od společnosti Microsoft a jejích partnerů.

Storage řešení pro Windows HPC Server 2008

Pro clustery založené na platformě Windows HPC Server 2008 nabízí Microsoft a jeho partneři mnoho typů storage řešení zahrnující technologii NAS, clustered NAS, sdílené úložné systémy SAN a, jakožto nejvýkonnější řešení, paralelní úložné systémy, které jsou zároveň nejnáročnější na počet výpočetních jader přítomných v clusteru.

NAS a clustered NAS

Architektura NAS se podobá tradičnímu file serveru vybavenému technologií direct-attached storage, pouze s tím rozdílem, že operační systém NAS serveru umožňuje pouze ukládání dat, přístup k datům a správu těchto funkcí. NAS používá file-based protokoly jako je Network File System (NFS) či Server Message Block (SMB). Řešení NAS může být realizováno několika způsoby: jako jednotlivá NAS zařízení, NAS zařízení seskupená do clusteru (clustered NAS) nebo jako virtuální filtry. Nejjednodušším řešením pro cluster je samostatné NAS zařízení, které s sebou však zároveň nese nejvíce omezení. Mnoho prodejců nabízí samostatná NAS řešení, která mohou být vybavena jednou až čtyřmi nebo i více síťovými kartami.

Windows Storage Server

Jedním z mnoha typů NAS řešení je Windows Storage Server. Výhodou je plnohodnotná integrace do prostředí Windows HPC Serveru 2008 (případně novějších verzí). To s sebou pochopitelně nese záruku kompatibility a unifikované správy. Použitím technologie Server Message Block (SMB) lze dostat přenosovou rychlost připadající na jednu síťovou kartu jednoho serveru s interním RAID polem nad úroveň 100 MB/s. Existují však také high-endové konfigurace poskytující transfer až do výše 500 MB/s. Podpora Distributed File System Namespace (DFSN) v rámci Windows Storage Serveru umožňuje sloučení dílčích síťových úložných zařízení do jediného virtuálního file systému, jehož největší předností je jednotný jmenný prostor. Výhodou DFSN je rovněž takřka neomezená kapacitní rozšiřitelnost a i zde platí zmíněná záruka součinnosti se systémy Windows.

Sdílený SAN, nebo clusterový file systém?

Pokud požadujete vyšší výkon v rámci jediného uzlu, pak je pro vás vhodnější alternativou sdílený file systém přístupný všem uzlům clusteru skrze storage area network (SAN). File systém SAN umožňuje souběžný přístup ke stejnému datovému úložišti (a dokonce i ke stejnému souboru) většímu množství počítačů zároveň. SAN navíc používá rychlejší přístupovou metodu k výpočetním uzlům než NAS. Sdílený file systém má také jinak řešenou "data path" vedoucí přímo z výpočetních uzlů do storage systému. Architektura SAN může být doplněna o metadata server (MDS), který centrálně zajišťuje přístup k file systému a uchovává jeho konzistentnost.

Paralelní, nebo clusterový file systém?

S paralelními file systémy má mnoho malých výpočetních uzlů svá data spravována velkým množstvím drobných storage uzlů; výpočetní uzly tudíž mohou přistupovat nezávisle na sobě (paralelně) ke storage uzlům v témže čase. Paralelní file systémy podporují velmi vysokou přenosovou rychlost a mohou být napojeny na tisíce výpočetních uzlů. V současné době je komerčně dostupných několik paralelních file systémů. Ty fungují na principu přenosu "file systems intelligence" (což je de facto informace o konfiguraci file systémů) na storage uzly a přístupu k souborům na základě objektové (souborové) identifikace; paralelní file systémy jsou již dnes dostupné pro Linux, přičemž verze pro Windows jsou brzy očekávány.

Správa storage

Ke správě storage řešení pro clustery na platformě Windows se neobejdete bez funkcí jako je failure monitoring (sledování chyb), change management (řízení změny), performance monitoring (sledování výkonu) a storage provisioning (přidělování úložného prostoru). Jejich dostupnost si můžete obstarat například použitím nástrojů Microsoft zahrnujících System Center Operations Manager, Storage Manager for SANs, File Server Resource Manager, Active Directory a System Center Data Protection Manager. S manažerským balíčkem Windows HPC Server 2008 management pack umožňuje System Center Operations Manager end-to-end servisní správu, která pomáhá snáze identifikovat a řešit záležitosti týkající se výkonu, zdraví a dostupnosti výpočetních clusterů na platformě Windows. Storage Manager for SANs umožňuje základní administraci SAN včetně identifikace zařízení, provozního zabezpečení, přidělení zařízení k serverům a správy technologie Microsoft multipath I/O. K administrátorským nástrojům od Microsoftu patří také File System Resource Manager poskytující funkce jako je quota management (řízení přenesených dat), file screening (kontrola souborů) či storage usage reporting (reportování o využití datového úložiště). K dispozici je pak celá řada nástrojů od partnerů společnosti Microsoft.

Začátek stránky Začátek stránky

© 2008 Microsoft Corporation. Všechna práva vyhrazena. Právní informace  |  Ochranné známky  |  Osobní údaje
Page view tracker