SQL Server 2012 als Business-Intelligence-Gesamtpaket

16. Mai 2012Michael Görs

Beschäftigt man sich mit dem neuen SQL Server 2012, trifft man auf eine Flut von mehr oder weniger marketingorientierten Informationen zu den Neuerungen wie PowerView, DQS, Columnstore Index und MDS. Am häufigsten findet man Bilder und Videos zu dem SharePoint-basierten Reporting und Data Exploration Tool „PowerView“. Was jedoch fehlt, ist eine nachvollziehbare Verknüpfung zwischen den neuen Features und den bereits vorhandenen Produkten.

Der SQL Server ist spätestens seit der Version 2008 kein reines Relational Database Management System (RDBMS) mehr. Es hat sich gezeigt, dass nur ein sehr geringer Anteil der User wirklich den vollen Umfang oder wenigstens einen großen Teil der Funktionalitäten nutzt, die der SQL Server bietet. Mit dem SQL Server 2012 will Microsoft genau das ändern. Unter dem Leitbegriff „Self-service“ wurden die technischen Möglichkeiten für einen Zugang durch eine breitere Benutzergruppe ausgerichtet. Im gleichen Atemzug wurden neue Inhalte ergänzt, die den SQL Server zu einer umfassenden BI-Lösung machen.

Betrachten wir uns nun die Inhalte des SQL Server 2012 als umfassendes BI- und DWH-Gesamtpaket. Hier gilt es, mit der Datenbasis zu beginnen. Im Bereich des DQM (Data Quality Management) wurden die neuen Data Quality Services (DQS) hinzugefügt. Diese sollen das große Problem der Datenqualität beheben, das eigentlich in fast jedem „lebenden“ Datenbestand vorkommt. Dazu wird der Benutzer mithilfe des DQS-Client befähigt, die Bereinigung und das Matching von Daten zu steuern. Das Ganze geschieht auf Basis einer Knowledge Base. Die Knowledge Base  ist eine Datenbank, die Domain-spezifische Informationen (z.B. Domain-Werte, Referenzdaten, Matching-Regeln, Bereinigungsregeln) enthält, die für die eigentliche Bereinigung der Daten herangezogen werden. Der Benutzer erstellt und pflegt die Knowledge Base ebenfalls über den DQS-Client. Ein integrierter Profiler unterstützt bei der Bewertung der erzielten Ergebnisse und bei der weiteren Optimierung der Knowledge Base. Insgesamt wird mit den DQS erreicht, dass die Optimierung der Datenqualität in die Hände von Mitarbeitern gelegt werden kann, die die Werte und Regeln der gespeicherten Inhalte kennen. Die Matching-Regeln der DQS Knowledge Base finden außerdem Anwendung im Matching-Prozess der Master Data Services (MDS). Die Master Data Services ermöglichen über ein Excel-Addin und ein umfangreiches Web-Frontend eine umfassende Bearbeitung und Verwaltung von Master Data. Innerhalb der Master Data Services erfolgt die Organisation in Versionen von Modellen. Diese Modelle enthalten die eigentlichen Entitäten, Attribute, Attributgruppen, Hierarchien und Business Rules der abzubildenden Datenstruktur.

Beide Tools in Kombination bieten weitreichende Möglichkeiten zum Aufbau einer Staging Area für ein DWH. Zur Einbindung von DQS und MDS in SSIS-(SQL Server Integration Services) Prozesse, gibt es beispielsweise eine Data-Flow-Komponente für DQS Data Cleansing (siehe Abb. 1).

Abbildung: Data-Flow-Komponente für DQS Data Cleansing

Abb. 1: Data-Flow-Komponente für DQS Data Cleansing

Auch die Master Data Services können über die neue Konzeption der MDS Staging Tables nun einfacher befüllt werden, da nun für jede Entität eigene Staging Tables erstellt werden, das Mapping damit deutlich einfacher und der ganze Prozess wesentlich performanter wird. In einer Prozesskette könnten die DQS den MDS vorgeschaltet sein, um bereinigte und standardisierte Daten zur weiteren Verarbeitung zur Verfügung zu stellen. Dies ist insbesondere dann von Vorteil, wenn Daten aus unterschiedlichen Quellsystemen verarbeitet werden.

Am anderen Ende des BI-Paketes steht nun das neue Reporting und Data Exploration Tool PowerView. PowerView ist eine Silverlight-Anwendung und steht ausschließlich in SharePoint zur Verfügung. Das Tool ermöglicht dem Endanwender, mit wenig Aufwand metadatenbasierte interaktive Reports zu erstellen, ohne die eigentliche Datenbasis kennen zu müssen. Auch in den fertigen Reports können die Anwender umfangreiche Filterfunktionalitäten nutzen, die einen tieferen Einblick in die Daten gewähren. Die fertigen Reports können außerdem nach PowerPoint exportiert werden.

Neben der Neuentwicklung von PowerView wurde auch das bereits bekannte PowerPivot weiterentwickelt. PowerPivot ist, in Abgrenzung zu PowerView, als Datenanalyse- und Auswertungswerkzeug zu verstehen. Es wurde um Funktionalitäten wie KPIs, Hierarchien und einer Diagrammansicht der Tabellenbeziehungen erweitert.

Zwischen der eigentlichen Datenbank und den End-User-Tools wie PowerPivot und PowerView wurde mit dem neuen SQL Server 2012 eine Ebene integriert, die es der IT ermöglicht, den End-Usern eine Datengrundlage bereitzustellen,  ohne dass diese die eigentliche Struktur der Datenbank verstehen müssen. Das BI Semantic Model (BISM), siehe Abb. 2, teilt sich in zwei Ansätze. Einerseits gibt es BISM multidimensional. Dies entspricht den bisherigen UDM-OLAP-Cubes mit MDX als Abfragesprache. Hinzu gekommen ist BISM Tabular. Im Vergleich zu den bisherigen multidimensionalen Modellen bietet diese Anwendung eine schnelle Modellerstellung mit geringerer Komplexität. Außerdem steht für Logik und Abfragen die neue Abfragesprache DAX zur Verfügung, die ebenfalls einfacher als MDX handhabbar ist. Des Weiteren bietet BISM Tabular einen rollen- und zeilenbasierten Security Layer, KPIs, (Parent-Child-)Hierarchien, Partitionen und Perspektiven. Die Kapazitäten sind im „normalen“ Abfrage-Modus nur durch den verfügbaren Hauptspeicher begrenzt. PowerPivot-Modelle können zudem in BISM-Tabular-Modelle konvertiert werden. Das Tabular Model ist Voraussetzung für die Nutzung von PowerView, da es ausschließlich mit DAX-Abfragen arbeitet, welche bisher nur vom Tabular Model unterstützt werden.

Abbildung BI Semantic Model (BISM)

Abb. 2: BI Semantic Model (BISM)

Insgesamt ist Microsoft mit dem neuen SQL Server 2012 einen sehr großen Schritt in Richtung einer umfassenden DWH- und BI-Lösung gegangen. Das reine RDBMS des SQL Server ist schon lange soweit ausgereift, um den meisten Anforderungen zu entsprechen. Mit PowerPivot, PowerView und dem BI Semantic Model wurden sehr gute Möglichkeiten zur Datenanalyse und Reporting geschaffen. Das BI Semantic Model ermöglicht dabei die zunehmende Verwendung der Analyse-Werkzeuge durch Business User und schafft damit eine klare Schnittstelle zwischen IT und Fachabteilung. Die DQM Werkzeuge MDS und DQS sind ein sehr guter Ansatz zur Verwaltung und Bereinigung von Daten. In der aktuellen Version zeigen sich jedoch durchaus noch Schwächen, die es in Zukunft noch auszubessern gilt. Dass genau dies geschehen wird, signalisiert Microsoft nicht nur durch Marketing-Aussagen, sondern auch durch die Schaffung einer gemeinsamen Entwicklungsabteilung für DQS, SSIS und MDS.

Arbeiten Sie bereits mit dem SQL Server 2012 sowie den neuen Komponenten? Welche Erfahrungen haben Sie bislang gesammelt? Haben Sie Fragen zum Thema und zu den einzelnen Anwendungsbereichen der BI-Lösung? Ich freue mich auf den Austausch mit Ihnen.

Michael Görs Michael Görs beschäftigt sich seit 2008 mit Business Intelligence und Data Warehousing im Kontext der Aufbereitung und Auswertung von Marktforschungsdaten. Als IT-Consultant und Software-Entwickler bei der adesso AG treibt er das Thema Business Intelligence mit dem Microsoft SQL Server 2012 voran. Zudem beschäftigt er sich mit Microsoft Dynamics CRM als Plattform zur Erstellung branchenspezifischer Lösungen.
Artikel bewerten:
1 Star2 Stars3 Stars4 Stars5 Stars
Loading...

Kommentar hinzufügen:

Ihr Kommentar: