Autor: Michal
Kvasnička, Sprinx
Systems,a.s.
Počítačové clustery se
různí v závislosti na našich požadavcích na jejich schopnosti, výkon,
případně i velikost. S tím úzce souvisí také nároky kladené na
storage řešení a způsobu jeho administrace. V tomto článku si
shrneme základní přehled storage produktů pro clustery založené na
platformě Windows HPC Server 2008.
Špatně zvolené řešení
datové základny může mít pro celkovou použitelnost clusteru velmi vážné
důsledky. Pomalý přenos dat, nedostatečná kapacita, špatný
přístup k datům, nedostačující odolnost vůči
výpadkům a v neposlední řadě i nekompatibilita patří mezi
nejčastější problémy s tím spojené. Při výběru storage
řešení se proto ohlížíme zejména na následující aspekty:
1. Výkon
Tradiční superpočítače
v rámci běžného použití obvykle pracují s přenosovou rychlostí
připadající na jedno výpočetní jádro kolem 100 MB/s (při
omezeném počtu těchto jader) nebo 50 MB/s (u systémů
využívajících až několik set uzlů). Pokud není hardware schopen této
přenosové rychlosti dosáhnout, proces datového přenosu a něm
závislé aplikace běží zbytečně pomaleji než je teoreticky možné.
V opačném případě, tj. při výrazně
nadprůměrném výkonu, resp. přenosové kapacitě storage
řešení, však vyhráno také nemáme, protože jádro nebo aplikace nemusí být
schopna větší množství dat v daném čase odeslat, resp. přijmout.
K optimálnímu zabezpečení požadavků na přenosovou rychlost je
třeba zohlednit velikost clusteru a množství aplikačních
procesů, které mohou běžet současně. Pro příklad -
cluster složený ze 100 čtyřjádrových uzlů při datovém toku
50 MB/s na jádro vyžaduje souhrnnou přenosovou kapacitu ve výši 20 GB za
sekundu (za předpokladu plného vytížení). Z toho plyne potřeba, aby
storage řešení bylo schopno této rychlosti dosáhnout.
2. Kapacita
Jakmile jsou definovány výkonnostní parametry,
je třeba určit čas, po který mají být data
zpřístupněna online, a objem datového úložiště, který k tomu
potřebujete. Z toho se odvíjejí požadavky na kapacitu storage řešení.
3. Přístupnost
Dalším důležitým aspektem je
přístup k datovému úložišti. Ne všechny výpočetní uzly nutně
potřebují přístup k celému datovému skladu, například proto, že
neprovozují aplikace, které s ním pracují. Požadavky na přístupnost jsou
tudíž odvozené od způsobu, jakým způsobem pracují aplikace
provozované clusterem. V případě, že kterékoliv aplikace mohou
běžet na kterémkoliv výpočetním uzlu, potom je nezbytné, aby všechny
uzly měly přístup k celému storage prostoru.
4. Jednotný jmenný prostor
S jednotným jmenným prostorem
(namespace) mají všechny uzly přístup k veškerým datům v témže
okamžiku. V některých případech je tato možnost přímo nezbytná.
NAS řešení (Network-attached storage), jako je Windows Storage Server
(WSS) a produkty dalších výrobců, sdílené SAN sítě (storage area networks)
za paralelními NAS branami, ale i paralelní úložné systémy jednotný jmenný
prostor mají. WSS navíc umožňuje sdílení jednotného jmenného prostoru
napříč vícero WSS systémy - což se nazývá Distributed File System
Namespace (DFSN). DFSN přináší jednoduchý management většího
počtu storage serverů, sdílení zátěže a automatizované
"failover" funkce umožňující okamžité přepnutí na záložní
systém v případě selhání.
5. Dostupnost
Je třeba se zamyslet také nad
tím, jakým způsobem bude celý storage systém dostupný pro cluster.
Požadavky na dostupnost lze řešit na úrovni serveru (vysoce dostupné NAS
brány), storage (JBOD nebo RAID), storage řadiče (failover nebo LUN)
a path (multipath failover, redundantní switche). K dispozici je velké množství
variant pro řešení dostupnosti storage.
Zhodnocení potřeb zákazníka v
uvedených pěti aspektech je výchozím krokem při volbě
optimálního storage řešení pro cluster. Následující text pojednává o
dostupných storage produktech od společnosti Microsoft a jejích
partnerů.
Storage řešení pro Windows HPC Server 2008
Pro clustery založené na
platformě Windows HPC Server 2008 nabízí Microsoft a jeho partneři
mnoho typů storage řešení zahrnující technologii NAS, clustered NAS,
sdílené úložné systémy SAN a, jakožto nejvýkonnější řešení, paralelní
úložné systémy, které jsou zároveň nejnáročnější na počet
výpočetních jader přítomných v clusteru.
NAS a clustered NAS
Architektura NAS se podobá
tradičnímu file serveru vybavenému technologií direct-attached storage,
pouze s tím rozdílem, že operační systém NAS serveru umožňuje pouze
ukládání dat, přístup k datům a správu těchto funkcí. NAS
používá file-based protokoly jako je Network File System (NFS) či Server
Message Block (SMB). Řešení NAS může být realizováno několika
způsoby: jako jednotlivá NAS zařízení, NAS zařízení seskupená do
clusteru (clustered NAS) nebo jako virtuální filtry. Nejjednodušším
řešením pro cluster je samostatné NAS zařízení, které s sebou však
zároveň nese nejvíce omezení. Mnoho prodejců nabízí samostatná NAS
řešení, která mohou být vybavena jednou až čtyřmi nebo i více
síťovými kartami.
Windows Storage Server
Jedním z mnoha typů NAS
řešení je Windows Storage Server. Výhodou je plnohodnotná integrace do
prostředí Windows HPC Serveru 2008 (případně novějších
verzí). To s sebou pochopitelně nese záruku kompatibility a unifikované
správy. Použitím technologie Server Message Block (SMB) lze dostat
přenosovou rychlost připadající na jednu síťovou kartu jednoho
serveru s interním RAID polem nad úroveň 100 MB/s. Existují však také
high-endové konfigurace poskytující transfer až do výše 500 MB/s. Podpora
Distributed File System Namespace (DFSN) v rámci Windows Storage Serveru
umožňuje sloučení dílčích síťových úložných zařízení
do jediného virtuálního file systému, jehož největší předností je
jednotný jmenný prostor. Výhodou DFSN je rovněž takřka neomezená
kapacitní rozšiřitelnost a i zde platí zmíněná záruka
součinnosti se systémy Windows.
Sdílený SAN, nebo clusterový file systém?
Pokud požadujete vyšší výkon v rámci
jediného uzlu, pak je pro vás vhodnější alternativou sdílený file systém
přístupný všem uzlům clusteru skrze storage area network (SAN). File
systém SAN umožňuje souběžný přístup ke stejnému datovému
úložišti (a dokonce i ke stejnému souboru) většímu množství počítačů
zároveň. SAN navíc používá rychlejší přístupovou metodu k
výpočetním uzlům než NAS. Sdílený file systém má také jinak
řešenou "data path" vedoucí přímo z výpočetních
uzlů do storage systému. Architektura SAN může být doplněna o
metadata server (MDS), který centrálně zajišťuje přístup k file
systému a uchovává jeho konzistentnost.
Paralelní, nebo clusterový file systém?
S paralelními file systémy má mnoho
malých výpočetních uzlů svá data spravována velkým množstvím drobných
storage uzlů; výpočetní uzly tudíž mohou přistupovat nezávisle
na sobě (paralelně) ke storage uzlům v témže čase.
Paralelní file systémy podporují velmi vysokou přenosovou rychlost a mohou
být napojeny na tisíce výpočetních uzlů. V současné době je
komerčně dostupných několik paralelních file systémů. Ty
fungují na principu přenosu "file systems intelligence" (což je
de facto informace o konfiguraci file systémů) na storage uzly a
přístupu k souborům na základě objektové (souborové)
identifikace; paralelní file systémy jsou již dnes dostupné pro Linux,
přičemž verze pro Windows jsou brzy očekávány.
Správa storage
Ke správě storage řešení
pro clustery na platformě Windows se neobejdete bez funkcí jako je failure
monitoring (sledování chyb), change management (řízení změny),
performance monitoring (sledování výkonu) a storage provisioning
(přidělování úložného prostoru). Jejich dostupnost si můžete
obstarat například použitím nástrojů Microsoft zahrnujících System
Center Operations Manager, Storage Manager for SANs, File Server Resource
Manager, Active Directory a System Center Data Protection Manager. S
manažerským balíčkem Windows HPC Server 2008 management pack umožňuje
System Center Operations Manager end-to-end servisní správu, která pomáhá snáze
identifikovat a řešit záležitosti týkající se výkonu, zdraví a dostupnosti
výpočetních clusterů na platformě Windows. Storage Manager for
SANs umožňuje základní administraci SAN včetně identifikace
zařízení, provozního zabezpečení, přidělení zařízení k
serverům a správy technologie Microsoft multipath I/O. K administrátorským
nástrojům od Microsoftu patří také File System Resource Manager
poskytující funkce jako je quota management (řízení přenesených dat),
file screening (kontrola souborů) či storage usage reporting
(reportování o využití datového úložiště). K dispozici je pak celá řada
nástrojů od partnerů společnosti Microsoft.
Začátek stránky