SQL Server 2012: Business Intelligence di livello avanzato

Le architetture di riferimento preconfigurate forniscono una guida di orientamento testata per la configurazione di SQL Server al fine di gestire carichi di lavoro di Business Intelligence.

Stephen Strong

Scarsamente performanti query sono la rovina di ogni transazione on-line, (OLTP) sistema di elaborazione. Si potrebbe cercare di migliorare le prestazioni hardware, ma il modo migliore per risolvere questo problema è quello di ottimizzare le query.

Potrebbe farlo cambiando la strategia dell'indice, modifica del codice o, più drasticamente, modificando lo schema della tabella. La ragione di che questo è che OLTP in genere ha un carico di lavoro prevedibile. Sapete che cosa è venuta dai server di applicazione ed è possibile progettare il sistema per soddisfare che.

Questo approccio raramente funziona, tuttavia, per i carichi di magazzino dati, soprattutto come database aumenta di dimensioni e di concorrenza. Forum sono pieni di DBA in cerca di aiuto indirizzamento poco performante, query di magazzino di dati complessi.

Anche se ci possono essere molti rapporti comunemente eseguire un carico di lavoro tipico business intelligence (BI), c'è spesso un mix di query ad hoc provenienti da vari altri strumenti. Queste sono imprevedibili e difficili da influenzare. Gli utenti regolarmente anche modificare le query, spesso attraverso uno strumento di BI, come essi forare i dati per estrarre il valore aziendale. Il tentativo di ottimizzare le query può sentire come una battaglia persa.

I responsabili IT, reagendo dalla frustrazione, spesso tentano di risolvere il problema lanciando hardware il problema. Comprerò un server di fascia alta e connettersi il più grande array di storage enterprise che possono permettersi nel loro budget. Se si desidera perdere credibilità con la comunità imprenditoriale, seguire questo percorso. Questo approccio raramente riesce ed è certamente un'opzione costosa per implementare una volta fattore di costi di licenza.

Microsoft ha collaborato con un numero di fornitori di hardware molto rispettata per trasformare questo problema sulla sua testa. Le società poste le domande: "Che cosa accadrebbe se abbiamo accettato che gli utenti spesso analizzati tabelle dei fatti grandi ed eseguire query complesse Group By? Che cosa accadrebbe se ogni componente in una soluzione in grado di funzionare a piena velocità e non essere bottiglia da un altro componente? Cosa sarebbe quel look like?"

Prendere il Fast Track

Immettere SQL Server Fast Track Data Warehouse (Fast Track DW). Dal 2005, Microsoft ha investito pesantemente nella ottimizzazione di SQL Server per carichi di lavoro BI. Nel 2009, Microsoft ha rilasciato la prima architettura di riferimento di Fast Track per i Data warehouse. Oggi ci sono nuove architetture di riferimento emergono che sfruttare nuove funzionalità di SQL Server 2012.

Fast Track DW non è un prodotto. È una serie di ben progettate, pre-configurazioni hardware e software progettati specificamente per affrontare questo problema. Non c'è nessun hardware speciale e nessun software di magico. È costruito su componenti di prodotto, ad esempio Windows Server e SQL Server.

Probabilmente hai già molti di questi componenti che operano all'interno dell'ambiente. Ciò che manca è quel cambiamento di mentalità operativa dalla prevenzione scansioni di grandi quantità di dati. Fast Track DW incoraggia apertamente che il comportamento, tanto che esso in realtà dipende da esso per le sue prestazioni fulminee.

Se non hai mai fatto alcun test di prestazioni hardware, siete capitati rapidamente alla conclusione che la maggior parte dei sistemi come letture sequenziali. Se si analizza la maggior parte dei carichi di lavoro BI, vedrai che sono costituiti in genere da letture sequenziali al 80-90%. Che cosa accadrebbe se avete progettato il sistema per soddisfare solo le letture sequenziali? Che cosa accadrebbe se i componenti, CPU, memoria, bus PCI, host bus adapter (HBA), rete, storage, SQL Server e i file di database — sono stati progettati anche per questo?

Ci possono essere problemi, però. Cosa succede se si dispone di dischi lenti o non abbastanza RAM o la HBA non può tenere il passo con i dischi, o un bus PCI diventa saturo? Peggio ancora, come si rimuove un collo di bottiglia aggiungendo più memoria o l'aggiornamento dei dischi da 10.000 a 15.000 RPM, un altro collo di bottiglia presto apparirà.

Un tipico scenario potrebbe andare qualcosa come questo: Un DBA chiede la squadra di infrastrutture più RAM in un computer SQL Server. Aggiunta la RAM risolve il primo problema, ma solo aumenta le prestazioni del 3 per cento. Immediatamente dopo l'aggiunta della RAM, si rivela un collo di bottiglia nel sottosistema del disco. Quando si chiede quindi l'imprenditore per una grossa fetta di denaro, come giudica le loro possibilità di ottenere finanziamenti aggiuntivi?

Per ovviare a questo, gli ingegneri hardware e software hanno sviluppato una serie di sistemi bilanciati che può servizio magazzini di dati di dimensioni diverse. Avviare i sistemi entry-level a 5TB, mentre i più grandi sistemi in grado di servire quasi 100TB database. Per magazzini di centinaia di terabyte di dati, Microsoft e i suoi partner hardware hanno assemblato un prodotto chiamato il Parallel Data Warehouse.

La maggior parte delle squadre di infrastruttura potrebbero costruire un sistema equilibrato come questo, ma che raramente hanno il tempo per analizzare e abbinare i componenti per ottenere il massimo rendimento potenziale. Se hai 20TB di archiviazione su dischi da 600 GB, ad esempio, è necessario determinare quante schede HBA avrete bisogno su quante porte switch a due processori di otto-core unità al 100 per cento. Inoltre dovete pianificare tali problemi di capacità come molti processori di archiviazione sarebbe necessario ottenere 6 GB al secondo di velocità di trasmissione dati.

Anche se molte squadre di infrastruttura considerano e piano per questi problemi, sistemi bilanciati lo fanno raramente nell'ambiente di produzione. L'architettura di riferimento tira fuori tutte le congetture.

Problemi di implementazione dell'infrastruttura sono noti per causare ritardi del progetto. Fast Track DW è progettato per migliorare il tempo di implementare metriche. Ogni architettura di riferimento viene fornito con un elenco di parti hardware predefiniti delle materie prime. È possibile convertire rapidamente questo in una distinta materiali a presentare al fornitore dell'hardware.

Perché i fornitori di hardware sono stati coinvolti nel mettere insieme queste architetture di riferimento, si dovrebbe prendere meno tempo effettivamente soddisfare l'ordine. Non è necessario andare avanti e indietro con il fornitore per quanto riguarda l'elenco dell'ordine. Non ci sono più discussioni sull'utilizzo di un processore da 2,4 GHz o un processore 2,5 GHz, Fibre Channel o iSCSI — la specifica è già definita.

Quando l'hardware si arriva sul sito, i ragazzi di infrastruttura non necessario discutere come meglio implementare la soluzione, come che è chiaramente articolato nell'architettura di riferimento. Queste informazioni includono il posizionamento del disco fisico, cablaggio, software e versioni dei driver, firmware, configurazione dell'archiviazione, profondità coda HBA, configurazione di SQL Server e inserimento di file di database anche.

Operatore veloce

Fast Track DW opera sul concetto di tasso massimo di Core (MCR). Questo descrive il numero massimo di megabyte al secondo che processore core può consumare all'interno della CPU. Processori multi-core di oggi possono consumare 300 MB a 400 MB di dati al secondo per ogni core. Ad esempio, su un server con due CPU socket e otto core per CPU, che si traduce in circa 6 GB al secondo. Per che, avrai quattro dual-port HBA capace di un rendimento totale sostenuto massimo di 6,4 GB al secondo. Ogni array di archiviazione sottostante contiene quattro set di dischi fisici in una configurazione RAID 10, che può generare 1,6 GB al secondo per un totale di 6,4 GB al secondo.

Architetture di riferimento Fast Track in genere specifica 10Gbit iSCSI o 8Gbit Fibre Channel per la rete di archiviazione su un interruttore dedicato. A differenza di un tipico ambiente SAN — dove archiviazione condivisa con più carichi di lavoro come file server, database server e host macchina virtuale — tutti lo stoccaggio è dedicato al server Fast Track.

Nulla è lasciato al caso. In molte architetture di riferimento, percorsi LUN vengono mappati a HBA, porte switch, processori di archiviazione e set di disco fisico. Questo riduce la contesa che può accadere quando si lascia che il traffico I/O da un disco insieme condividere un percorso con traffico di I/O da altro. Nessun componente dovrebbe essere consentito di inondare il canale di un altro componente. Tutto dovrebbe essere in grado di eseguire in parallelo alla massima velocità.

Costruzione e la configurazione di soluzione magazzino dati ad alte prestazioni su hardware più recente sarebbe un compito importante. Per creare una build ripetibile, squadre di infrastruttura spesso trascorrono ore traina attraverso guide all'installazione, blog e forum per costruire script complessi richiesti.

Le architetture di riferimento sono più appena elenchi delle parti e alcune statistiche di prestazioni. Anche se c'è qualche variazione tra i fornitori di hardware, architetture di riferimento includono anche script per configurare l'hardware. Se il pensiero di tutti i componenti di montaggio sembra un po ' scoraggiante, ci sono alcuni venditori che hanno programmi per spedire tutto travasato e pre-assemblati.

Indice miglioramenti

SQL Server 2012 introduce un nuovo tipo di indice denominato un ColumnStore. ColumnStores sono tutti circa le prestazioni e migliorare il rapporto prestazioni prezzo. Ogni riga di dati viene elaborato in una query non ColumnStore. Con ColumnStore, si possono avere righe di processo di SQL Server in batch. È non solo i dati per una colonna su più righe memorizzate su una pagina singola, ma si può anche avere elaborati in batch. In cima a che i dati sono fortemente compresso. Questo funziona per essere approssimativamente un rapporto di 7-1.

ColumnStore fornisce molto migliore velocità effettiva perché la CPU overhead è ridotto durante l'esecuzione di query. Elaborazione richiede meno RAM, che ben si adatta all'architettura DW Fast Track e i/o. ColumnStore indici forniscono un miglioramento delle prestazioni di 10-100 volte massiccia su indici basati sulle righe regolari.

Tieni presente che non tutte le query possono usufruire degli indici di ColumnStore. Recenti test hanno dimostrato una media generale incremento delle prestazioni dei due tempi è più ragionevole attraverso un carico di lavoro misto. Ancora, una Spinta di prestazioni del 100 per cento per relativamente poco sforzo è certamente la pena. Così che cosa è il fermo? Non è possibile aggiornare gli indici ColumnStore. Ma la maggior parte delle applicazioni di magazzino di dati possono far fronte con questa limitazione durante loro estrarre, trasformare e caricare il processo.

Architetture di riferimento più recenti stanno cominciando a sostenere un'elevata disponibilità per Fast Track DW. Come BI diventa più business-critical, è certamente una buona notizia. Architetture di riferimento disponibili attualmente in uso la sempre affidabile tecnologia di Clustering di Failover di Windows Server, è stata utilizzata negli ambienti OLTP per più di un decennio.

Un vantaggio chiave dell'utilizzo di architetture di riferimento Fast Track è che usano software regolari come Windows Server e SQL Server. Questo è utile per gli amministratori di sistema, amministratori e personale di supporto. Anche se gli sviluppatori dovranno iniziare a pensare un approccio indice-luce, regolare T-SQL ancora verrà eseguito su Fast Track. Perché Fast Track è un'architettura di riferimento e non un prodotto confezionato, gestione delle patch è semplice come pure. Si può semplicemente aggiungere il server al vostro processo di gestione delle patch regolari.

Integrazione di Fast Track

Perché Fast Track è costruito su SQL Server 2012, si integra bene nella maggior parte delle architetture di BI. Sistemi di origine possono alimentare il DW Fast Track tramite un Server di SQL Server Integration dedicato o un archivio di dati operativi. È possibile esporre dati attraverso dipartimentale data mart costruito sulla cima di SQL Server Analysis Services o strumenti di BI accedere direttamente Fast Track.

C'è una tendenza crescente di dare agli utenti l'accesso a dati portali con dashboard e PowerPivot o PowerView con SharePoint. SQL Server Reporting Services è in grado di esporre relazioni strutturate via cubi di analysis services. Gli utenti possono creare report ad hoc in Generatore Report o utilizzare PowerPivot per Excel. Con queste opzioni e miglioramenti delle prestazioni, è facile vedere come una piattaforma scalabile come DW Fast Track per SQL Server 2012 può diventare una componente fondamentale della vostra strategia di BI.

Stephen Strong

Stephen Strong ha più di 25 anni di esperienza con sistemi di database, dall'architettura dell'applicazione e DBA mentoring per design e architettura dell'infrastruttura. Negli ultimi nove anni, lavorando in collaborazione con Microsoft Services, è stato strumentale nella progettazione architettonica ed il supporto di alcune implementazioni di SQL Server più grandi e più complesse dell'australiano.

Contenuti correlati