Dieser Artikel wurde maschinell übersetzt.

SQLServer 2012: Bessere Business Intelligence

Vorkonfigurierte Referenzarchitekturen bieten Ihnen eine getestete Roadmap zum Konfigurieren von SQL Servern zum Verwalten von Business Intelligence-Arbeitsauslastungen.

Stephen Strong

Schlechter Leistung Abfragen sind der Fluch von jedem System online Transaction processing (OLTP). Sie könnten zur Verbesserung der Hardwareleistung aussehen, aber der beste Weg, um dieses Problem zu lösen ist, solche Abfragen zu optimieren.

Sie können dies erreichen, durch die Index-Strategie ändern, Ändern des Codes oder mehr dramatisch verändert das Tabellenschema. Der Grund, warum, den Dies funktioniert, ist, dass OLTP typischerweise vorhersehbare Arbeitsauslastung. Sie wissen, was die Application Server kommt, und Sie können das System für die gerecht gestalten.

Dieser Ansatz funktioniert selten, jedoch für Daten-Lager-Arbeitslasten, vor allem als Datenbank-Größe und Parallelität erhöht. Community-Foren sind voll von DBAs sucht Hilfe Adressierung schlecht funktionierenden, komplexe Data Warehouse-Abfragen.

Obwohl es möglicherweise viele häufig führen Sie Berichte in einer typische Business Intelligence (BI) Arbeitsauslastung, gibt es oft eine Mischung aus ad-hoc-Abfragen, die aus verschiedenen anderen Tools. Dies sind unberechenbar und schwer zu beeinflussen. Benutzer ändern auch regelmäßig ihre Abfragen, oft über ein BI-Tool, wie sie in die Daten extrahieren Geschäftswert zu bohren. Versuch, diese Abfragen optimieren kann wie eine verlorene Schlacht fühlen.

IT-Manager, aus Frust, reagieren, versuchen oft, dieses Problem zu beheben, durch das Werfen von Hardware das Problem. Sie kaufen einen High-End-Server und verbinden Sie es mit den größten Unternehmen-Speicher-Arrays können, den Sie innerhalb ihres Haushalts leisten. Wenn Sie mit Ihrem Business-Community unglaubwürdig möchten, folgen Sie diesem Pfad. Dieser Ansatz nur selten gelingt und ist sicherlich eine teure Option implementieren, wenn Sie Faktor in Lizenzkosten.

Microsoft teamed oben mit einer Reihe von angesehenen Hardware-Anbieter, dieses Problem auf den Kopf zu machen. Die Unternehmen stellten die Fragen: "Was würde passieren, wenn wir angenommen, dass Benutzer oft große Faktentabellen gescannt und komplexe Group By Abfragen durchgeführt? Was würde passieren, wenn jede Komponente in einer Lösung mit voller Geschwindigkeit arbeiten und konnten nicht von einer anderen Komponente beseitigt werden? Wie würde die aussehen?"

Der schnelle Weg zu nehmen

Fast-Track-Data-Warehouse (Fast-Track DW) für SQLServer eingeben. Seit 2005 hat Microsoft stark bei der Optimierung von SQL Server für BI-Arbeitslasten investiert. Im Jahr 2009 veröffentlichte Microsoft die erste Fast-Track-Referenzarchitektur für Data Warehouses. Heute gibt es neue aufstrebende Referenzarchitekturen, die neuen Features in SQL Server 2012 nutzen.

Fast Track-DW ist ein Produkt nicht. Es ist eine Reihe von ausgereiften, getestete Hardware- und Softwarekonfigurationen speziell entwickelt, um dieses Problem zu beheben. Es gibt keine spezielle Hardware und keine magische Software. Es baut alles auf Ware-Komponenten, z. B. Windows Server und SQL Server.

Sie haben wahrscheinlich schon viele dieser Komponenten in Ihrer Umgebung. Was fehlt, ist die operative Geist Abkehr von scannt umfangreiche Daten zu verhindern. Fast Track-DW fördert dieses Verhalten, so viele offen, so dass es eigentlich für seine blitzschnelle Leistung abhängt.

Wenn Sie je gemacht haben, jede Hardware-Performance-Tests haben Sie schnell zu dem Schluss gekommen, dass die meisten Systeme wie sequenzielle Lesevorgänge. Wenn Sie die meisten BI-Arbeitslasten analysieren, sehen Sie, dass sie in der Regel bestehen aus 80 bis 90 Prozent sequenzielle Lesevorgänge. Was würde passieren, wenn Sie Ihr System, nur um sequenzielle Lesevorgänge bieten entworfen? Was würde passieren, wenn Ihre Komponenten — CPU, Speicher, PCI-Bus, host Busadapter (HBAs), Netzwerk, Speicher, SQL Server und Datenbankdateien — wurden auch für diese entwickelt?

Gibt es Probleme, obwohl. Was passiert, wenn Sie nicht genügend RAM und langsamen Festplatten oder die HBAs haben nicht mithalten mit den Datenträgern oder ein PCI-Bus wird gesättigt? Schlimmer noch, wird wie Sie ein Engpass entfernen, indem Sie mehr Speicher hinzufügen oder aktualisieren die Festplatten von 10.000 bis 15.000 u/min, ein weiterer Engpass bald erscheinen.

Ein typisches Szenario könnte etwa so gehen: Ein DBA fragt das Infrastrukturteam für mehr RAM in einem SQL-Server. Hinzufügen von RAM löst das erste Problem, aber nur steigert Leistung um 3 Prozent. Unmittelbar nach Hinzufügen von RAM, offenbart ein Engpass bei der Datenträger-Subsystem. Wenn es weiter die Unternehmer für einen großen Teil des Geldes fragt, wie bewerten Sie ihre Chancen auf zusätzliche Finanzierung?

Um dieses Problem zu umgehen, haben Hardware und Software-Ingenieure eine Reihe von ausgewogenen Systeme entwickelt, die unterschiedlicher Größe Datawarehouses bedient werden können. Einstiegssysteme beginnen bei 5TB, während größere Systeme fast 100TB Datenbanken bedienen können. Für Datawarehouses in die Hunderte von Terabyte, Microsoft und seine Hardwarepartner zusammengestellten ein verpacktes Produkt namens der Parallel Data Warehouse.

Die meisten Infrastruktur-Teams konnte ein ausgeglichenes System wie folgt aufzubauen, doch sie haben nur selten Zeit zu untersuchen und entsprechen der Komponenten um den maximalen möglichen Durchsatz zu erreichen. Haben Sie 20 TB Speicher auf 600 GB Festplatten, müssen beispielsweise Sie wieviele HBAs bestimmen Sie, auf wie viele Switch-Ports zu Laufwerk zwei acht-Kern-Prozessoren zu 100 Prozent brauchen. Sie müssten auch, solche Kapazitätsprobleme zu planen, und wie viele Speicherprozessoren müssten Sie 6 GB pro Sekunde Durchsatzrate zu erreichen.

Obwohl viele Infrastruktur-Teams prüfen und für diese Themen planen, machen ausgewogene Systeme nur selten es in einer Produktionsumgebung einsetzen. Die Referenzarchitektur nimmt das Rätselraten.

Infrastruktur-Umsetzungsfragen sind bekannt für Projektverzögerungen verursacht. Fast Track-DW soll Zeit für die Durchführung von Metriken zu verbessern. Jede Referenz-Architektur kommt mit einer vordefinierten Ware Hardware-Teileliste. Sie können dies schnell in eine Stückliste auffordern, Ihren Hardwarehersteller konvertieren.

Da Hardware-Anbieter bei der Zusammenstellung dieser Referenzarchitekturen beteiligt waren, sollten sie weniger tatsächlich Lieferung der Bestellung dauern. Sie müssen nicht mehr hin und her mit Ihren Lieferanten bezüglich der Bestellliste zu gehen. Es gibt keine weitere Diskussionen über die Verwendung einer 2,4 GHz-Prozessor oder einen 2,5 GHz Prozessor, Fibre Channel oder iSCSI-Spezifikation ist vordefiniert.

Wenn die Hardware vor Ort eintrifft, brauchen die Infrastruktur-Jungs nicht zu erörtern, wie Sie am besten die Lösung implementieren, die eindeutig in die Referenzarchitektur artikuliert wird. Diese Informationen umfassen physikalische Datenträger-Platzierung, Verkabelung, Software und Treiberversionen, Firmware, Speicherkonfiguration, HBA Warteschlange tiefen, SQL Server-Konfiguration und sogar Datenbank Dateiplatzierung.

Schnell-Operator

Fast Track-DW bezieht sich auf das Konzept der maximale Core Rate (MCR). Dies beschreibt die maximale Anzahl von Megabytes pro Sekunde, die der Prozessorkern innerhalb der CPU verbrauchen kann. Heutige Multicore-Prozessoren können 300 MB bis 400 MB an Daten pro Sekunde pro Kern belegen. Beispielsweise auf einem Server mit zwei CPU-Sockel und acht Kernen pro CPU übersetzt, die ca. 6 GB pro Sekunde. Um das voranzutreiben, haben Sie vier Dual-Port HBAs eine maximale Gesamt Durchsatzrate von 6,4 GB pro Sekunde fähig. Jedes zugrunde liegenden Speicher-Array enthält vier Gruppen physischer Festplatten in einem RAID 10-Konfiguration können die 1,6 GB pro Sekunde für insgesamt 6,4 GB pro Sekunde erzeugen.

Fast Track-Referenzarchitekturen geben in der Regel 10Gbit iSCSI oder vollwertigen für Fibre Channel Storage Network auf einen dedizierten Schalter. Im Gegensatz zu einer typischen SAN-Umgebung — denen Speicher freigegeben mit mehrere Arbeitslasten wie File-Server, Datenbankservern und virtuellen Computerhosts — die Lagerung widmet sich der Fast-Track-Server.

Nichts wird dem Zufall überlassen. LUN-Pfade werden in vielen Referenzarchitekturen HBAs, Switch-Ports, Speicherprozessoren und physikalischer Datenträger-Sets zugeordnet. Dadurch verringert sich die Behauptung, die geschehen können, wenn Sie Datenverkehr von einem Datenträgersatz einen Pfad mit Datenverkehr von einem anderen teilen lassen. Keine Komponente darf, den Kanal von einer anderen Komponente zu überfluten. Alles sollte parallel mit maximaler Geschwindigkeit ausgeführt werden können.

Erstellen und konfigurieren Ihre eigenen Hochleistungs-Daten-Warehouse-Lösung auf die neueste Hardware wäre eine wichtige Aufgabe. Zum Erstellen eines wiederholbaren stundenlang Infrastruktur Mannschaften oft Troll durch Installationsanleitungen, Blog-Posts und Community-Foren, um die komplexen Skripten erforderlich zu bauen.

Die Referenz-Architekturen sind mehr als nur die Stücklisten und einige Performance-Statistiken. Obwohl es einige Variationen zwischen Hardware-Anbieter gibt, auch Referenzarchitekturen Skripts, um die Hardware zu konfigurieren. Wenn der Gedanke an die Montage aller Komponenten ein wenig beängstigend scheint, gibt es einige Anbieter, die Programme, um alles zerbrach und vormontiert geliefert haben.

Index-Verbesserungen

SQL Server 2012 wird eine neue Art von Index bezeichnet eine ColumnStore eingeführt. ColumnStores sind alle über Leistung und Preis/Leistungsverhältnis zu verbessern. Jede Datenzeile wird in einer nicht-ColumnStore-Abfrage verarbeitet. Mit ColumnStore können Sie SQL Server-Prozess-Zeilen in den Reihen haben. Die Daten ist nicht nur für eine Spalte über mehrere Zeilen auf einer einzigen Seite gespeichert, aber Sie können auch sie stapelweise verarbeitet. Obendrein werden die Daten stark komprimiert. Diese funktioniert auf ein Verhältnis von ca. 7-1 sein.

ColumnStore bietet einen viel höheren Datendurchsatz, da die CPU overhead reduziert wird, während der Ausführung von Abfragen. Verarbeitung erfordert weniger i/o und RAM, die auf die Überholspur-DW-Architektur gut geeignet ist. ColumnStore Indizes ermöglichen eine massive Leistungssteigerung von 10 bis 100 Mal über regelmäßige zeilenbasierte Indizes.

Denken Sie daran, dass nicht alle Abfragen ColumnStore Indizes nutzen können. Den letzten Leistungstests haben durchschnittlich insgesamt gezeigt, dass Leistungssteigerung von zwei Mal über eine gemischte Arbeitsauslastung mehr zumutbar ist. Dennoch lohnt eine 100 Prozent Leistungssteigerung für relativ wenig Aufwand. Was ist der Haken? ColumnStore Indizes können nicht aktualisiert werden. Aber die meisten Data Warehouse-Anwendungen können fertig werden mit dieser Einschränkung während ihrer Extrakt, transformieren und laden Prozess.

Neuere Referenz-Architekturen auch beginnen, hohe Verfügbarkeit für Fast Track DW zu unterstützen. Da BI mehr geschäftskritische wird, ist dies sicherlich eine gute Nachricht. Derzeit verwenden verfügbare Referenzarchitekturen die immer zuverlässige Windows Server Failover-Clustering-Technologie, die seit mehr als einem Jahrzehnt in OLTP-Kreisen verwendet wurde.

Ein wichtiger Vorteil der Verwendung von Fast Track-Referenzarchitekturen ist, dass sie regelmäßige Software wie Windows Server und SQL Server. Dies ist hilfreich für Systemadministratoren, Datenbankadministratoren und Support-Mitarbeiter. Obwohl Entwickler über einen Index-Licht Ansatz nachdenken müssen, laufen reguläre T-SQL noch auf Überholspur. Da Fast-Track eine Referenzarchitektur und kein boxed-Produkt ist, ist Patch-Management als auch unkompliziert. Sie können Ihren regulären Patch-Management-Prozess einfach den Server hinzufügen.

Fast-Track-Integration

Da Fast-Track auf SQL Server 2012 aufbaut, fügt es sich gut in die meisten standard-BI-Architekturen. Quellsysteme können die Fast Track-DW über einen dedizierten SQL Server-Integration-Server oder einem operativen Datenspeicher ernähren. Sie können Daten über Abteilungs-Datamarts baut auf SQL Server Analysis Services verfügbar machen oder haben Ihre BI-Tools zugreifen Fast Track direkt.

Es gibt eine wachsende Tendenz, Benutzer Zugang zu Daten-Portale mit Dashboards und Gemini oder PowerView mit SharePoint. SQL Server Reporting Services können strukturierte Berichte über Analysis Services-Cubes verfügbar machen. Ihre Benutzer können ad-hoc-Berichte im Berichts-Generator erstellen, oder verwenden PowerPivot für Excel. Mit diesen Optionen und Performance-Verbesserungen ist es leicht zu sehen, wie eine skalierbare Plattform wie Fast Track DW für SQL Server 2012 eine Kernkomponente Ihrer BI-Strategie werden kann.

Stephen Strong

Stephen Strong hat mehr als 25 Jahre Erfahrung mit Datenbanksystemen aus Anwendungsarchitektur und DBA mentoring zu Infrastrukturarchitektur und Design. In den letzten neun Jahren wurde in Zusammenarbeit mit Microsoft Services in der architektonischen Gestaltung und Unterstützung einiger Australiers größten und komplexesten SQL Server-Implementierungen instrumental er.

Verwandte Inhalte