Big Data und Information Management: Die größte Herausforderung liegt in den Köpfen, nicht in der Technologie

21. November 2013Dr. Thomas Franz

Bauchgefühl vs. Fakten und Informationen

Jedes Unternehmen erstellt, bearbeitet und speichert Informationen über seine Kunden und seine Produkte. Typischerweise auch Informationen über die Prozesse, die Kunden und Produkte verbinden, beispielsweise Bestellungen, Wartungen oder die Nutzung eines Produkts. Diese Informationen helfen dabei, den Geschäftsbetrieb zu verstehen. Überblickt man sie ganzheitlich, ist man in der Lage, die richtigen strategischen Entscheidungen zu treffen. Fehlt der Überblick über die vorhandenen Informationen, müssen sich Entscheidungen verstärkt auf Intuition oder abgeleitete Informationen stützen – Verkaufszahlen beispielsweise. Letztere beantworten zwar, ob ein Produkt mehr oder weniger häufig verkauft wurde, sagen aber leider nicht aus, warum. Sie sind daher nützlich, um getroffene Entscheidungen zu überprüfen, aber nur bedingt tauglich, um neue Entscheidungen zu treffen. Verständnis kann nur der Überblick über operative Informationen geben. Informationen zu überblicken, ist jedoch keine einfache Aufgabe. Viele Unternehmen betreiben Hunderte – größere Unternehmen oft Tausende – von Anwendungen. Informationen sind in zahlreichen Datenbanken, Logfiles, oft auch in Tabellenkalkulationen zersplittert und dort isoliert. Um dennoch den nötigen Überblick zu erhalten, muss sich der Umgang mit Informationen in Unternehmen wandeln. Dies erfordert einen methodischen und technologischen Paradigmenwechsel.

Erste Beispiele einer erfolgreichen Umsetzung dieses Paradigmenwechsels gibt es bereits, zum Beispiel MetLife’s „The Wall„: Eine sehr einfach zu bedienende Anwendung, die einen Überblick über Informationen aus über 70 Systemen bei einer Versicherung liefert und mit der diese Informationen einfach durchstöbert werden können.

Eine Information-Management-Herausforderung

Wollen wir einen Überblick gewinnen, dann müssen wir mit vielen Anwendungen, Datenbanken, Datenquellen, mit der Unterschiedlichkeit, der darin enthaltenen Informationen, mit Duplikaten, mit falschen Informationen, und fehlender Information umgehen. All das summiert sich zu einer großen Menge an Informationen. Die Herausforderung besteht darin, vor diesem Hintergrund kontinuierlich den Prozess des Information Management zu ermöglichen, den wir so definieren:

  • Information sammeln (aus unterschiedlichsten Quellen)
  • Information verwalten (speichern, verfügbar halten, analysieren)
  • Informationen bereitstellen, so dass Mitarbeiter darin stöbern, explorieren und suchen können

Die etablierte Umgangsform scheitert

Der verbreitete Information-Management-Ansatz ist vielfach stark durch die eingesetzte Technologie bestimmt. Es gilt die Regel „Daten kommen in die Datenbank“. Damit ist typischerweise die eine relationale Datenbank gemeint, für die sich ein Unternehmen entschieden hat. Unabhängig von Hersteller und Lizenzmodell implementieren diese Datenbanken alle dieselbe Umgangsform für Daten, die sich so skizzieren lässt:

  • Daten modellieren (in der Form von Relationen, Konsistenz- und Integritätsbedingungen, siehe E. F. Codd, A Relational Model of Data for Large Shared Data Banks, 1970)
  • Daten erfassen, z.B. eingeben oder importieren (laden)
  • Daten anfragen (per standardisierter Anfragesprache, z.B. SQL)

Diese Umgangsform und die dazu entwickelte Technologie sind insbesondere geeignet, wenn folgende Bedingungen erfüllt sind:

  • Sämtliche Daten sind vollständig bekannt und können daher vorab detailliert beschrieben werden.
  • Veränderungen des hintergründigen Geschäftsprozesses sind selten, sodass aufwendige Neumodellierungen selten erforderlich sind.
  • Das Datenvolumen ist gut abschätzbar, sodass die benötigten Kapazitäten für die Informationsverarbeitung einmalig eingekauft werden können.

Stellen wir diese Umgangsform den heutigen Realitäten für ein überblickendes Information Management gegenüber, dann sehen wir einen offensichtlichen Widerspruch (siehe Tabelle).

Die etablierte Umgangsform gelangt vor dem Hintergrund heutiger Informationslandschaften an ihre Grenzen. Sie ist meiner Meinung nach ein Grund für das Scheitern vieler Unternehmen, ihre Information-Management-Ziele zu erreichen. Sie ist teilweise auch ein Grund für Zielverfehlungen von Data-Warehouse- und Business-Intelligence-Projekten.

Eine neue und alltägliche Umgangsform?

Überblick zu schaffen fordert eine andere Umgangsform für Informationen und damit auch neue Anforderungen für die verwendete Informations- und Datenbanktechnologie. Um den oben skizzierten Prozess des Information Management vor dem Hintergrund verschiedenster Informationsquellen und der Zersplitterung von Informationen konzeptuell stabil etablieren zu können, bedarf es eines Ansatzes, der diesen Prozess als iterativen Erkenntnisprozess realisiert.

Hier ein Vorschlag:

  • Information sammeln – ohne hohen Vorabmodellierungsaufwand – trotz fehlerhafter, fehlender und variierender Informationen und unterschiedlicher Strukturierung dieser.
  • Information verwalten und analysieren, um aus den gesammelten Informationen zu lernen – kontinuierlich.
  • Information bereitstellen, z.B. in der Form grafischer Darstellungen, aber auch über einfach zu nutzende Explorationswerkzeuge für Fachabteilungen.

Alle drei Schritte müssen ausgeführt werden können – auch unter den oben genannten Gegebenheiten von Fehlerhaftigkeit, fehlender Information und unterschiedlicher Information. Die folgende Grafik skizziert diesen Prozess.

Die Erfüllung dieser Eigenschaften bedeutet eine andere Umgangsform und erfordert von der verwendeten Datenbanktechnologie insbesondere zwei Eigenschaften:

  • Flexibilität, damit die Sammlung von Informationen trotz Unterschiedlichkeit, fehlender oder variierender Detailinformationen (Attribute) nicht den Information-Management-Prozess stoppt und insbesondere Vorabmodellierung nicht den Prozess langfristig verzögert.
  • Horizontale Skalierbarkeit, um auf wachsende Informationsmengen oder wechselnde Performanceanforderungen reagieren zu können.

Not only SQL (NoSQL) Technologie – reicht das?

Viele der NoSQL-Datenbanken erfüllen grundsätzlich die technologischen Anforderungen für ein überblickendes Information Management zu einem höheren Grad als die meisten der relationalen Datenbanken. Sie erfordern typischerweise keine fein-granulare Modellierung der verwendeten Informationen auf Attributebene und unterstützen eine (horizontale) Skalierung zur Laufzeit. Dadurch kann der Information-Management-Prozess kontinuierlich ausgeführt werden. In der folgenden Tabelle ist die Realisierung der Anforderungen an Flexibilität und Skalierbarkeit erläutert.

Kopfsache: Eine andere Erwartungshaltung und Umgangsform

Die NoSQL-Technologie kommt den Anforderungen also näher. Sie beantwortet allerdings nicht die Frage, wie mit Ungenauigkeit, Qualitätsmängeln der Daten und der Komplexität der Datenintegration umgegangen werden soll. Hier wird es in absehbarer Zeit sicherlich auch nicht die perfekte Lösung geben. Dennoch – es ist meiner Meinung nach, ein sehr wertvoller Schritt Überblick zu erlangen – und dafür Unschärfe in Kauf zu nehmen. Wir alle sind bereits gewohnt, mit Unschärfe umzugehen – aus der täglichen Nutzung von Internetsuchmaschinen. Wir sind es gewohnt, dass Suchresultate auch weniger präzise Treffer enthalten können, nehmen dies jedoch in Kauf, weil wir nur so das größte Informationssystem der Welt nahezu vollständig durchsuchen können und nicht nur die Top 2% aller Webseiten, deren Informationen vorab sorgfältig modelliert und für die Suchmaschine beschrieben wurden, um vollständig exakte Antworten liefern zu können.

Die große Herausforderung sehe ich daher in der Übertragung dieser im privaten Umfeld bekannten Umgangsform auf Unternehmen. Dazu benötigt es sowohl technologische Skills, analytisches und fachliches Knowhow also auch organisatorische Veränderungen.

Fazit

Ohne Überblick wird es schwierig, geschäftliche Entscheidungen zu treffen, denn auf welchen Fakten (Daten) sollen sie basieren oder wollen wir uns auf das Bauchgefühl alleine verlassen? Übersicht bedeutet, Daten aus mehreren Quellen über ein einzelnes, einfach zu bedienendes User Interface anfragen und überblicken (z.B. durchstöbern) zu können. Diese Zielsetzung überschneidet sich mit Zielen von Big-Data-Projekten – und auch den dortigen Anforderungen. Die Beherrschung der Unternehmensdaten ist ein wichtiger Erfolgsfaktor – und eine wachsende Herausforderung. Die Umsetzung einer zeitgemäßen Information-Management-Strategie bedeutet einen Paradigmenwechsel. Dieser ist uns allerdings nicht völlig unbekannt.

Haben Sie noch den vollen Überblick über Ihre Informationen? Wie gehen Sie mit Ihren Daten um? Sind Big Data oder NSQL bereits Optionen für Sie? Ich freue mich auf Ihre Fragen und Kommentare.

Dr. Thomas Franz Dr. Thomas Franz ist Technologieexperte bei adesso. Er interessiert sich für die Themen Big Data, Lean Startup und DevOps sowie deren Zusammenwirken mit technologischen Trends wie NoSQL-Datenbanken, Cloud-Infrastrukturen und modernen Web-Architekturen.
Artikel bewerten:
1 Star2 Stars3 Stars4 Stars5 Stars
Loading...

Kommentar hinzufügen:

Ihr Kommentar: