Lade Inhalt...

Das Data Warehouse als Lösung für das betriebliche Datenchaos

von Florian Englisch (Autor) Bettina Vogl (Autor)

Akademische Arbeit 2016 27 Seiten

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungsverzeichnis

1 Einleitung

2 Die Grundlagen des Data Warehouse und die strategische Umsetzung
2.1 Das analytische Chaos als unternehmerisches Problem
2.2 Historie der Management-Informationssysteme
2.3 Data-Warehouse - Definition und Begriffsabgrenzung
2.4 Die Architektur des Data-Warehouse-Systems

3 Würdigung des Data Warehouse
3.1 Der Mehrwert eines Data Warehouse-Systems
3.2 Mögliche Problematiken der Implementierung eines Data Warehouse-Systems
4 Zusammenfassung der wesentlichen Ergebnisse und Zukunftsausblick

Quellenverzeichnis

Literaturquellen

Internetquellen

Abbildungsverzeichnis

Abbildung 1: Referenzarchitektur eines Data-Warehouse

Abbildung 2: Hub and Spoke Architektur

Abbildung 3: OLAP-Würfel

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

„Daten sind das neue Öl.“[1] – Diese Metapher verdeutlicht, wie wichtig Informationen in der heutigen Zeit geworden sind. Die komplette Geschäftsstrategie von bekannten Unternehmen wie Google und Facebook basiert auf der Sammlung und Auswertung von Daten. Auch in Zukunft wird diese Entwicklung weiter voranschreiten, sodass schrittweise weitestgehend alle Branchen vor einem tiefgreifenden Wandel stehen. Experten fassen diese Bewegung unter dem Begriff „Big Data“ zusammen.[2] Als „Big Data“ wird die stetig steigende Datenflut bezeichnet, die die Unternehmen in der heutigen Zeit vor immer neue Herausforderungen stellt. Big Data stellt Unternehmen vor neue Herausforderungen in Bezug auf den Umgang mit Daten. Hierbei zeichnen sich die neuen Anforderungen vor allem durch das deutlich gesteigerte Volumen der gespeicherten Daten aus. Neben dem Volumen wird auch die Anzahl der Quellen, die Daten anbieten, weiter zunehmen. Für die Unternehmen bedeutet dies, sich frühzeitig einen detaillierten Überblick über die potenziellen Quellen zu verschaffen und sich für die hochwertigsten zu entscheiden, um nicht im Nachhinein mit der Masse der Daten überfordert zu sein. Denn auch die Geschwindigkeit verändert sich drastisch. Wo bisher ein wöchentlicher Report ausgereicht hat, wird in Zukunft eine Echtzeitanalyse erwartet. Aber neben den Anforderungen steigen auch die Chancen, die mit Big Data einhergehen. Der technologische Fortschritt führt zu einer vollständigen Veränderung der Datenverwaltung und bringt damit auch neue Analysemöglichkeiten hervor.[3]

Gerade in Bezug auf den betrieblichen Datenhaushalt wird diese Entwicklung in den Fokus gerückt. Nachdem diese Thematik sowohl den Schwerpunkt der Hannoverschen IT-Messe CeBIT in 2014 darstellte, als auch im Folgejahren 2015 und 2016 eine zentrale Rolle spielte, wird deutlich, dass die Unternehmen auf der Suche nach effizienten Methoden sind, die Datenflut zu regulieren.[4] Die Identifizierung des Nutzens der Daten wird auch weiterhin in der Zukunft zu einem immer bedeutsameren Produktionsfaktor heranwachsen, sodass es sich kein Unternehmen leisten kann, dieses Fachgebiet zu vernachlässigen. Durch die effiziente Analyse der Daten kann sich ein Unternehmen einen realen Wissens- und damit auch einen Wettbewerbsvorteil erarbeiten, der bei der strategischen Ausrichtung zu einem der erfolgsentscheidenden Faktoren gezählt werden kann.[5]

Um diese effiziente Analyse der Daten zu ermöglichen, setzen viele Unternehmen Data-Warehouse-Systeme ein, deren wesentliche Aufgabe darin besteht, den betrieblichen Entscheidungsprozess zu unterstützen und eine Struktur in die analytischen Prozesse zu bringen.[6] Bevor diese Arbeit auf eine kritische Würdigung eines solchen Data-Warehouse eingeht, beschreibt Kapitel 2 wie sich das analytische Chaos auf die Entwicklung der Management Informationssysteme (MIS) ausgewirkt hat. Die permanente Weiterentwicklung der Management Informationssysteme führte zur heute bekannten Struktur des Data Warehouse, welche in Kapitel 2.4 thematisiert wird.

2 Die Grundlagen des Data Warehouse und die strategische Umsetzung

2.1 Das analytische Chaos als unternehmerisches Problem

In der Theorie wird die strategisch relevante Position der Datenanalyse stets betont. Doch häufig findet sich in der Praxis eine ganz andere Realität wieder, die von einem ständigen Wandel geprägt ist. Neben sich ändernden Kundenwünschen, regulatorischen Anforderungen oder technischen Weiterentwicklungen gibt es viele weitere Faktoren, die Unternehmen dazu zwingen, sich permanent an die neuen Gegebenheiten anzupassen. Dieser Veränderungszwang spiegelt sich auch in der Systemlandschaft wieder.[7] Die Schnelllebigkeit der Informationstechnologie führte dazu, dass Trends und Neuerungen sehr schnell in die bestehende IT-Infrastruktur übernommen. Bei der Umstellung werden häufig einzelne Altsysteme übergangen, da sich deren Erneuerungen wirtschaftlich nicht begründen lassen oder gar nicht realisierbar sind. Dies führt dazu, dass die IT-Landschaft eines Unternehmens immer auch ein Spiegelbild der technischen Entwicklungsschritte der letzten Jahrzehnte darstellt. Neben der technischen Weiterentwicklung lässt sich auch die betriebliche Entwicklung des Unternehmens an der Systemlandschaft ablesen. Betriebswirtschaftliche Faktoren, wie zum Beispiel die Erschließung eines neuen Geschäftsfeldes oder neue regulatorische Anforderungen haben immer direkte Auswirkungen auf die IT-Infrastruktur, denn diese muss die erforderlichen Prozesse adäquat bereitstellen. Die durch die technischen und betrieblichen Veränderungsprozesse entstandene Heterogenität der Systemlandschaft führt zu einer erhöhten Komplexität bezüglich der Beherrschbarkeit der Systeme, denn den Evolutionserfordernissen stehen die steigenden Anforderungen an die Nutzbarkeit der Daten gegenüber.[8] Diese Kernproblematik einer jeden sich heutzutage im Wandel befindenden Systemlandschaft wird auch als „Analytisches Chaos“ bezeichnet, denn mit den Änderungen steigen die Anforderungen an die Analysemöglichkeiten der betrieblichen Daten unaufhaltsam.[9]

Das Hauptmerkmal des „Analytischen Chaos“ ist die unzureichende oder unklare Qualität der Daten. Die Auswirkungen der ungenügenden Datenqualität sind sehr weitreichend. Aufgrund der bedeutsamen Entscheidungen, die basierend auf der Datenqualität getroffen werden, sind die Konsequenzen eines mangelhaften Datenhaushaltes sehr weitreichend und häufig irreparabel. Diese Verfehlung lässt sich maßgeblich auf die undefinierte Herkunft der Daten zurückführen. Häufig ist den Unternehmen nicht bewusst, welche Herkunft ihre Daten haben und wie sich einzelne Werte berechnen. Viele Unternehmen haben unzureichende Kenntnisse über die eigenen Systeme und deren Funktionsweise. Als Konsequenz sind die die analytischen Prozesse oft nicht detailliert genug dokumentiert. Häufig kann nicht sichergestellt werden, dass die Datenbasis alle relevanten Datensätze enthält. Die Fragestellung der korrekten Analyse kann somit nicht adäquat beantwortet werden.[10]

Um diesen Problemen entgegenzuwirken, setzen viele Unternehmen Data-Warehouse-Systeme ein. Deren wesentlichen Aufgaben bestehen darin, den betrieblichen Entscheidungsprozess zu unterstützen und durch eine einheitliche Datenbasis die analytischen Prozesse zu untermauern.[11] Damit diese einheitliche Datenbasis erstellt werden kann, müssen die Unternehmen eine konsistente Business Intelligence (BI) Strategie verfolgen. Unter dem Begriff Business Intelligence wird die Wandlung von strukturierten und unstrukturierten Daten in handlungsrelevantes Wissen bezeichnet. Dieses Wissen bezieht sich auf entscheidungsrelevante Kenntnisse über die Situation des eigenen Unternehmens oder das Marktumfeld. Der identifizierte Informationsbedarf wird anhand aussagekräftiger Quellen gestillt, die dem Nutzer anschließend in aufbereiteter Form durch Analysen und Reportings ersichtlich sind.[12] Die BI-Strategie definiert hierbei unternehmensweite Richtlinien und Vorgaben, die für die effiziente Analyse der Daten notwendig sind. Dazu gehören auch die verwendeten Technologien, wie zum Beispiel die erwähnten Data-Warehouse(DWH)-Systeme oder das Data Mining Verfahren.[13]

2.2 Historie der Management-Informationssysteme

Die stetige Weiterentwicklung der Computersysteme weckte in den 1960er-Jahren den Wunsch nach umfassenderen Aufbereitungsmöglichkeiten für betriebliche Informationen, um diese für die Unterstützung der Entscheidungsfindung nutzbar zu machen. Dieser Gedanke gipfelte in der Entwicklung der Management-Informationssysteme, die die unternehmerischen Entscheider mit relevanten Informationen in Berichtsform versorgen und somit eine fundiertere Entscheidungsfindung ermöglichen sollten.[14] Anfang der 1970er-Jahre entwickelten sich die Decision Support Systems (DSS), die im Gegensatz zu den MIS verschiedene Methoden und Modelle für die Entscheidungsfindung anbieten. DS-Systeme legen den Fokus vermehrt auf die Unterstützung des Entscheidungsprozesses als auf die reine Informationsversorgung der Entscheider anhand von Berichten.[15] Die nächste Generation der entscheidungs-unterstützenden Systeme entstand Ende der 1980er-Jahre in Form der Executive Information Systems (EIS). Die zunehmende Verbreitung von Personal Computern (PC) sowie die tiefergehende Verflechtung der Datenverarbeitungssysteme ließen den MIS-Gedanken neu aufleben. Die Aufbereitung von mehreren Datenquellen zu entscheidungsunterstützenden Berichten gewann durch die neuen Technologien weiter an Bedeutung. Die generierten Berichte konnten den Entscheidungsträgern effizient zur Verfügung gestellt werden und ermöglichten somit eine vereinfachte Kommunikation bei der Entscheidungsfindung.[16] Weiter an Dynamik gewann dieser Anwendungsbereich in den 1990er-Jahren durch die Entwicklung des Data-Warehouse-Konzeptes. Die Integration mehrerer Datenquellen zu einer gemeinsamen Datenbasis, die die Grundlage für On-Line Analytical Processing (OLAP) und Business Intelligence legte, war ein Meilenstein für das Voranschreiten der Datenanalyse.[17]

Im Laufe der Zeit beschränkte sich der Empfängerkreis nicht mehr nur auf die Managementebene, sondern vielmehr auf alle Mitarbeiter, die solche Informationen benötigten. Zudem haben sich die Zeitintervalle, in denen die Daten abgefragt werden, massiv verkürzt. Wo früher noch monatliche Reportings ausgewertet wurden, sind heutzutage Realtime-Abfragen keine Seltenheit mehr. Die zunehmende Operationalisierung der Data-Warehouse-Systeme spiegelt sich auch in der Architektur wieder, die die schnelle Integration sowie die flexible Einbindung von vielseitigen Ausweitungsmöglichkeiten ermöglichen muss.[18]

2.3 Data-Warehouse - Definition und Begriffsabgrenzung

Die Vielseitigkeit der Data-Warehouse-Thematik zeigt sich auch in der Literatur, die eine Vielzahl an unterschiedlichen Interpretationsansätzen für den Begriff liefert. Einzeln betrachtet, sind Daten Informationen, die „zum Zweck der Übertragung, Interpretation oder Verarbeitung formalisiert dargestellt sind.“[19] Der Begriff Warehouse (dt. Lagerhaus) setzt in diesem Zusammenhang den Datenfluss der betrieblichen Systeme in eine Analogie mit den Waren eines Lagerhauses, die genauso wie die Daten innerhalb eines Unternehmens und über die Grenzen eines Unternehmens hinaus gehandelt werden.[20] Zusammengesetzt bedeutet dies, dass sich der Begriff des Data-Warehouse sinngemäß mit einem Lagerhaus für Daten übersetzen lässt.[21]

Der Begriff wurde maßgeblich durch W. H. Inmon geprägt[22], der ein Data-Warehouse als „a subject oriented, integrated, non-volatile and time variant collection of data in support of management’s decisions“[23] beschreibt.

Nach dieser Definition lässt sich ein Data-Warehouse klar von den operativen Anwendungssystemen abgrenzen, da nicht die einzelnen Transaktionen, sondern beispielsweise Umsatz- oder Kostenkennzahlen zu einem bestimmten Themengebiet (subject oriented) im Fokus stehen. Die Daten werden aus den verschiedenen Quellsystemen in das Data-Warehouse integriert (integrated) und stehen dem Nutzer permanent (non-volatil) zur Verfügung. Die Ablage der Daten erfolgt in Anbetracht des Zeitbezuges (time variant), um einen möglichst großen Erkenntnisgewinn bei der Analyse der Daten zu ermöglichen. Der Kerngedanke hinter dem Data-Warehouse-Konzept ist es, die Daten aus den verschiedenen Quellen systematisch zusammenzuführen und in eine zentrale Datenbasis zu integrieren, um die Entscheidungsträger mit entscheidungsrelevanten Informationen zu versorgen.[24]

In Verbindung zu dem Schlagwort Data-Warehouse werden in der Literatur häufig auch die Begriffe Data-Warehouse-System und Data-Warehousing genannt.

Das Data-Warehouse-System umfasst im Gegensatz zu dem einfachen Data-Warehouse nicht nur die zu den Quellsystemen redundante Datenbasis, sondern alle für den Data-Warehousing Prozess erforderlichen Komponenten. Unter Data-Warehousing wird der prozessuale Ablauf von der Datenbeschaffung, über die Datenhaltung bis hin zur Datenanalyse verstanden..[25]

2.4 Die Architektur des Data-Warehouse-Systems

Der Definition nach sollte ein Data-Warehouse den „single point of truth“ (dt.: einzige Quelle der Wahrheit) darstellen und damit der einzige zentrale Ort sein, an dem die Daten aggregiert zur Verfügung stehen. Alle weiteren Datenausschnitte werden auf Basis dieser Datengrundlage erstellt.[26]

Eine Konsolidierung der verschiedenen Datenquellen hin zu einer bereichsübergreifenden Datenbasis, als Grundlage für eine effiziente BI-Landschaft, kann nur mit Hilfe einer einheitlichen Datenintegrationsstrategie erreicht werden. In diesem Zusammenhang wird im folgenden Abschnitt der Muster-Aufbau einer Data-Warehouse-Architektur vorgestellt.

Die in Abbildung 2 beschriebene Data-Warehouse-Architektur versteht sich als idealtypischer Entwurf, der bei der praktischen Umsetzung an die unternehmens-spezifischen Rahmenbedingungen angepasst werden muss.

[...]


[1] CeBit (2016), http://www.cebit.de/de/news-trends/trends/..., abgerufen am 10.05.2016.

[2] Vgl. King, S./ Hajnal, I. (2014), S.18f.

[3] Vgl. Bayer, M. (2012), http://www.computerwoche.de/a/big-data..., abgerufen am 17.05.2016.

[4] Vgl. CeBit (2016), http://www.cebit.de/de/news-trends/trends/..., abgerufen am 10.05.2016.

[5] Vgl. Keuper, F. u.a. (2013), S. 247f.

[6] Vgl. Gansor, T./ Totok, A./ Stock, S. (2010), S. 16f.

[7] Vgl. Lemke, C./ Brenner, W. (2014), S. 239f.

[8] Vgl. Gansor, T./ Totok, A./ Stock, S. (2010), S. 14f.

[9] Vgl. Apel, D. u.a. (2009), S. 18ff.

[10] Vgl. Apel, D. u.a. (2009), S. 18ff.

[11] Vgl. Gansor, T./ Totok, A./ Stock, S. (2010), S. 16f.

[12] Vgl. Mertens, P. (2001), S. 83f.

[13] Vgl. Bauer, A./ Günzel, H. (2009), S. 13f.

[14] Vgl. Gabriel, R./ Gluchowski, P./ Pastwa, A. (2009), S. 20f.

[15] Vgl. Gluchowski, P./ Gabriel, R./ Dittmar, C. (2008), S. 63f.

[16] Vgl. Chamoni, P. (1999), S. 422f.

[17] Vgl. Müller, J. (2000), S. 213.

[18] Vgl. Winter, R. u.a. (2008) S. 2.

[19] Stahlknecht, P./ Hasenkamp, U. (2005), S. 10f.

[20] Vgl. Mucksch, H./ Behme, W. (2000), S. 7.

[21] Vgl. Abts, D./ Mülder, W. (2009), S. 251f.

[22] Vgl. Farkisch, K. (2011) S. 5.

[23] Inmon, W. H. (1996), S. 33.

[24] Vgl. Farkisch, K. (2011) S. 6.

[25] Vgl. Goeken, M. (2006), S. 16f.

[26] Vgl. Inmon, W. H./ Strauss, D. / Neushloss,G. (2008), S. 7.

Details

Seiten
27
Jahr
2016
ISBN (eBook)
9783668737839
ISBN (Buch)
9783668737846
Dateigröße
774 KB
Sprache
Deutsch
Katalognummer
v429783
Institution / Hochschule
FOM Essen, Hochschule für Oekonomie & Management gemeinnützige GmbH, Hochschulleitung Essen früher Fachhochschule
Note
1,0
Schlagworte
Data Warehouse BI Business Intelligence OLAP Daten Informationen Datenbank Integration Layer Data Storage single point of truth Datenqualität Auswertungen

Autoren

Zurück

Titel: Das Data Warehouse als Lösung für das betriebliche Datenchaos