Lade Inhalt...

Herausforderung im effizienten Umgang mit Daten unter Berücksichtigung von unterschiedlichen Datenquellen

©2021 Hausarbeit 33 Seiten

Zusammenfassung

Diese Arbeit handelt von einer theoretischen Betrachtung und der konkreten Umsetzung am Beispiel des fiktiven Unternehmens, der Schätzle Finance und Insurance GmbH, unter Berücksichtigung entsprechender Datenbanksysteme, sowie einem Datenkonzept.

Eine Vielzahl an Datenquellen, das steigende Datenvolumen, sowie unterschiedliche Datenbanktechnologien, welche oft auch durch den Einsatz von Applikationen eingeschränkt bzw. vorgegeben sind, erhöhen die Komplexität im Umgang mit Daten.
Für Organisationen ergeben sich daraus verschiedene Herausforderungen im Umgang mit Daten, wie auch bei der Auswertbarkeit von Daten. Datenkonzepte müssen dies entsprechend berücksichtigen. Die Auswahl der richtigen Technologien und Konzepte
sind in der Regel von strategischer Bedeutung. Das Datenkonzept ist entscheidend für den Erfolg des Unternehmens und die Möglichkeit Daten richtig nutzen und einsetzen zu können. Im Falle, dass ein führendes Datenbanksystem nicht zum Einsatz kommen kann, sind entsprechende Konzepte zu entwickeln, welche dieses mögliche Defizit ausgleichen.

Leseprobe

Inhaltsverzeichnis

Abkürzungsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

1 Einleitung
1.1 Problemstellung
1.2 Zielsetzung
1.3 Aufbau der Arbeit

2 Theoretische Grundlagen
2.1 Business Intelligence
2.1.1 Herausforderungen einer fehlende BI-Strategie.
2.1.2 Gründe für eine BI-Strategie
2.2 Daten
2.2.1 Strukturierte Daten
2.2.2 Unstrukturierte Daten
2.3 Datenkonzept
2.3.1 Entity Relationship Modell
2.3.1.1 Entität
2.3.1.2 Attribute
2.3.1.3 Relationship
2.3.1.4 Schlüssel
2.3.1.5 Beispiel für ein Entity Relationship Modell
2.3.2 Normalisierung
2.3.2.1 Normalform 1
2.3.2.2 Normalform 2
2.3.2.3 Normalform 3
2.4 Datenbankmanagementsysteme
2.4.1 Anforderungen an ein Datenbankmanagementsystem
2.4.2 Softwarearchitektur von Datenbankmanagementsystemen
2.4.3 Arten von Datenbankmanagementsystemen
2.4.3.1 Relationale Datenbankmanagementsysteme
2.4.3.2 XML Datenbanken
2.4.3.3 NoSQL
2.5 Datenhaltung
2.5.1 Data-Warehousing
2.5.1.1 Quellsysteme
2.5.1.2 Staging Area
2.5.1.3 Cleaning Area
2.5.1.4 Core
2.5.1.5 Mart
2.5.2 Datenhaltung in der Cloud
2.6 Zusammenfassung

3 Anwendungsteil / Wesentliche Fragestellung
3.1 Strategie als Ausgangsage
3.1.1 Unternehmensstrategie
3.1.2 IT-Strategie des Unternehmens
3.1.3 BI-Strategie des Unternehmens
3.1.3.1 Fachlich
3.1.3.2 Technisch
3.1.3.3 Organisatorisch
3.2 Anforderungen an ein neues Datenkonzept
3.3 Datenkonzept
3.4 Applikationslandschaft
3.5 Datenbankmanagementsysteme
3.6 Data-Warehousing unter dem Einbezug von Cloud Services
3.7 Was wurde nicht berücksichtigt

4 Diskussion

5 Fazit Ausblick

Literaturverzeichnis

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Abbildungsverzeichnis

Abbildung 1: Beispiel Entity Relationshop Modell – erstellt mit GitMind, eigene Darstellung

Abbildung 2: Einfache Softwarearchitektur in Anlehnung an Piepmeyer1

Abbildung 3: Entity Relationship Modell der SFI, eigene Darstellung

Abbildung 4: DWH Konzept, eigene Darstellung

Tabellenverzeichnis

Tabelle 1: Zuordnung kommerzielle bzw. open source DBMS, eigene Darstellung

Tabelle 2: eingesetztes DBMS für jeweilige Applikation, eigene Darstellung

1 Einleitung

Oft denkt man bei Datenbanken automatisch an die Produkte der großen Anbieter wie IBM, Oracle oder Microsoft. Am Umsatz orientiert sind die Systeme IBM DB/2, Oracle DB und MS-SQL der oben genannten Anbieter heute führend am Markt.2Die Datenbankanbieterlandschaft ist derzeit allerdings einem starken Wandel unterworfen. Es kommen neue Systeme wie PostgreSQL, MariaDB, mySQL bzw. Systeme von Cloud Anbietern, wie Microsoft, Amazon oder Google immer häufiger zum Einsatz. Als Grund hierfür wird oft das Tool Set genannt, welches näher am Kunden orientiert ist. Zudem kommen Open-Source Modelle zum Tragen, welche nicht nur in Bezug auf die Preismodelle vorteilhaft sein können, sondern auf Grund der größeren Community die daran arbeitet, z.T. auch leistungsfähiger bzw. robuster sein können. Zudem sind solche Datenbanksysteme oft auch als Cloud Service konzipiert, was ebenfalls einen Megatrend in der IT bedient.3

Trotz der attraktiv klingenden Faktoren neuer Modelle entscheiden sich IT-Leiter in vielen Fällen immer noch für klassische Anbieter bzw. deren Produkte, welche eingangs genannt wurden. Warum ist dem so? Was können Kriterien bei der Entscheidung sein? Die Auswahl von Datenbanksystemen ist sehr komplex und hat häufig strategische Bedeutung für Unternehmen und Organisation. Diese Arbeit soll sich diesem Thema nähern und einen möglichen Entscheidungsprozess für ein Datenbankmanagementsystem am Datenkonzept orientiert aufzeigen.

1.1 Problemstellung

Eine Vielzahl an Datenquellen, das steigende Datenvolumen, sowie unterschiedliche Datenbanktechnologien, welche oft auch durch den Einsatz von Applikationen eingeschränkt bzw. vorgegeben sind, erhöhen die Komplexität im Umgang mit Daten.

Für Organisationen ergeben sich daraus verschiedene Herausforderungen im Umgang mit Daten, wie auch bei der Auswertbarkeit von Daten. Datenkonzepte müssen dies entsprechend berücksichtigen. Die Auswahl der richtigen Technologien und Konzepte sind in der Regel von strategischer Bedeutung. Das Datenkonzept ist entscheidend für den Erfolg des Unternehmens und die Möglichkeit Daten richtig nutzen und einsetzen zu können. Im Falle, dass ein führendes Datenbanksystem nicht zum Einsatz kommen kann, sind entsprechende Konzepte zu entwickeln, welche dieses mögliche Defizit ausgleichen.

1.2 Zielsetzung

Am Beispiel eines fiktiven Unternehmens soll die Herausforderung im effizienten Umgang mit Daten auf Grund steigender Mengen und Komplexität dargestellt werden. Es soll hierfür die Datenhaltung und damit einhergehend ein Datenkonzept erarbeitet werden. Konkret sollen die Anforderungen an das Datenbanksystem, sowie das Datenkonzept formuliert werden.

Ziel der Arbeit ist es, einen hierfür relevanten theoretischen Hintergrund zu geben und diese Grundlagen an einem fiktiven Unternehmen in Teilen anzuwenden, sowie damit entstehende Herausforderungen zu benennen.

1.3 Aufbau der Arbeit

Der Abschnitt 1 führt über die Problemstellung zum Thema hin und geht auf die Zielsetzung und den Aufbau der Arbeit ein.

Im folgenden Abschnitt 2 werden theoretische Grundlagen vermittelt. In diesem Abschnitt werden auf Business Intelligence eingegangen und unterschiedliche Datenformate dargestellt. Weiter wird auf Datenkonzepte, im Speziellen dem ER-Modell eingegangen. Darauf aufbauend werden Datenbankmanagementsysteme und mögliche Arten der Datenhaltung erläutert. Dieser Abschnitt schließt mit einer Zusammenfassung ab.

Im Anwendungsteil in Abschnitt 3 wird zu Beginn ein fiktives Unternehmen vorgestellt. Ausgehend von der Strategie des fiktiven Unternehmens wird die IT- und BI-Strategie entwickelt. Diese bilden die Basis für die Anforderungen an das Datenkonzept, sowie dem Datenbankmanagementsystem, bzw. einem weiteren Lösungsansatz.

Im Abschnitt 4 werden im Speziellen der Anwendungsteil kritisch diskutiert und mögliche weitere Sichtweisen skizziert. Die Arbeit schließt in Abschnitt 5 mit einem Fazit und dem Ausblick und möglichen Entwicklungen ab.

2 Theoretische Grundlagen

2.1 Business Intelligence

Business Intelligence (BI) kann als die Bereitstellung zur Nutzung von Daten bezeichnet werden. Daten sind hierbei konsistent und einheitlich aufbereitet, als Grundlage um Entscheidungen treffen zu können. Interne und externe Daten sollen weiter in handlungsgerechtes Wissen überführt werden.4

Dieses Ziel zu erreichen kann bestimmte Herausforderungen mit sich bringen. Weiter sollte BI strategisch angegangen werden. Konkret sollten sich Unternehmen eine BI-Strategie erarbeiten. Herausforderungen einer fehlenden BI-Strategie und Gründe für eine BI-Strategie werden in den folgenden beiden Abschnitten erläutert.

2.1.1 Herausforderungen einer fehlende BI-Strategie.

Fehlt eine BI-Strategie in einem Unternehmen kann es zu folgenden drei Herausforderungen kommen. Wird in einem Unternehmen BI ohne Vorgaben und strategische Ausrichtung eingesetzt kommen in vielen Fällen unterschiedliche Tools zum Einsatz. Man spricht hier auch von einem Tool Zoo. Hier entsteht mit der Zeit eine technische Herausforderung (1) . Weiter werden häufig ohne Vorgaben BI Aktivitäten aus verschiedenen Abteilungen und Bereichen entwickelt. In der Regel sind diese nicht aufeinander abgestimmt, haben eine Silosichtweise und verfolgen demnach häufig eigene nicht aufeinander abgestimmte Ziele. Hierbei handelt es sich um eine fachliche Herausforderung (2) . Die dritte Herausforderung ist die Herausforderung aus dem Vorgehen (3) . Das bedeutet, dass auf Grund der fehlenden Vorgaben und unterschiedlicher Datenqualität, die Herkunft der Daten nicht klar ist und ggf. auf unterschiedlichen Leveln BI betrieben wird, weil die analytischen Prozesse nicht definiert sind. Diese drei Herausforderungen führen z.T. auch direkt zu den Gründen für eine BI-Strategie, welche im nächsten Abschnitt erläutert werden.5

2.1.2 Gründe für eine BI-Strategie

Wie im Abschnitt zuvor aufgeführt kann eine fehlende BI-Strategie zu technischen Herausforderungen führen. Gründe für könnten also ein einheitliches Tool Set sein. Dies kann zu positiven Effekten in Bezug auf Kosten führen. Es muss nur ein System angeschafft, gewartet und dafür Lizenzgebühren bezahlt werden. Zudem können alle Mitarbeiter auf ein bzw. wenige Tools geschult werden. Es können somit wieder positive Kosteneffekte wie auch Multiplikatoreneffekte entstehen.

Ein weiterer Grund für eine BI-Strategie ist das Begegnen von organisatorischen Herausforderungen. Mit einer BI-Strategie wird die Akzeptanz im Unternehmen für BI, siehe hierzu auch nochmals den nächsten Absatz, und der Einsatz von Tools steigen, sowie der Tatsache Rechnung getragen werden, dass Verantwortlichkeiten klar geregelt sind.6

In vielen Fällen kann der Einsatz von BI ohne entsprechende Strategie vom Tagesgeschäft getrieben sein.7Mit entsprechender Strategie wären diese Aktivitäten zielgerichtet und würden, ausgehend davon, dass die BI Strategie die Unternehmensstrategie bedient, das Gesamtunternehmensziel fördern. Dies ein sehr wichtiger, wenn nicht der wichtigste Grund für eine BI-Strategie und sollet immer wieder überprüft werden.

2.2 Daten

Daten bestehen aus Zeichen wie Zahlen und Buchstaben. Werden diese Zeichen in einen regelbasierten Zusammenhang gebracht, dann spricht man von Daten. Beispiel: 4, 3 und k sind Zeichen. Im Zusammenhang kann diese 4,3k sein. Diese bedeutet 4,3 Kilogramm, wenn man davon ausgeht, dass k als Kilogramm definiert ist8. Solche Daten können in unterschiedlichen Formaten vorliegen. Zwei dieser Formate soll im Folgenden erläutert werden.

2.2.1 Strukturierte Daten

Strukturierte Daten liegen häufig in Form von Zahlenwerten und Texten vor und unterliegen einem Bestimmten Muster. Sie sind häufig bereits in Tabellenform vorhanden. Sie sind somit strukturiert abgelegt oder können strukturiert bearbeitet werden. Im Unternehmensumfeld liegen die Daten häufig in dieser Form vor und werden in Tabellen abgespeichert. Der Umgang mit Tabellen ist verhältnismäßig einfach mit Algorithmen zu bearbeiten.9Solche Datenbanksysteme sind relationale Datenbanksysteme, auf die im weiteren Verlauf noch detaillierter eingegangen wird.

2.2.2 Unstrukturierte Daten

Demgegenüber gibt es auch Daten, die diesen Kriterien nicht entsprechen. Man spricht hier von unstrukturierten Daten. Dies können Daten aus dem Internet sein, Posts z.B., welche als zusammenhängende Kommunikation abgespeichert sind. Weiter können dies Daten sein, die auf Ton oder Bildmaterial beruhen. Der Umgang mit diesen Daten ist in der Regel deutlich komplexer. Der Vorteil besteht aber darin, dass hierbei ggf. andere oder mehr Erkenntnisse gezogen werden können. Dies erfordert häufig anderes Knowhow, sodass hier einfache Datenbankkenntnisse nicht mehr ausreichen, sondern Data-Scientisten zum Einsatz kommen.10

2.3 Datenkonzept

Dem Datenkonzept bzw. einer Datenbankerstellung gehen verschiedenen Grundgedanken voraus. Zwei sehr wichtige Ansätze hiervon sollen im Folgenden erläutert werden.

Zum einen sind Daten so abzulegen, dass sie konsistent sind und bleiben können. Hierfür ist das Design über Modelle notwendig. Im Folgenden wird auf das Entity Relation Modell eingegangen. Unter Zuhilfenahme der Diagrammform, dem Entity Relation Diagramm, kann so ein Datenkonzept entwickelt werden.11

Weiter sind Daten zu normalisieren, um eine Grundlage für die weitere Verwendung zu schaffen und ebenfalls, um Inkonsistenzen zu vermeiden.

2.3.1 Entity Relationship Modell

An einem Datenbankprojekt arbeiten in der Regel unterschiedliche Disziplinen in einem Unternehmen. Auf der einen Seite Datenbankentwickler und auf der anderen Seite ggf. die Anwender bzw. Prozessverantwortlichen. Um ein einheitliches Verständnis für die zukünftige Datenbank zu bekommen, wird in der Regel ein Model verwendet. Sehr gängig ist hier das Entity Relationship Modell (ER-Modell). In diesem Modell wird dargestellt, welche Daten notwendig sind bzw. vorhanden sind und was diese miteinander zu tun haben. Im Folgenden wird auf die Entität, deren Attribute und die Beziehung zwischen den Entitäten eingegangen. Ein weiterer wichtiger Aspekt hierfür sind Primärschlüssel, welche auch in einem ER-Modell dargestellt werden.12Ein Beispiel schließt diesen Unterabschnitt ab.

2.3.1.1 Entität

Die Entität kann grundsätzlich alles Bestimmbare und Identifizierbare sein. Dies können z.B. Kunden oder Lieferanten sein, aber auch Aufträge oder Lagerbestände. Die Entität muss eindeutig benannt werden und hat Attribute, welche im nächsten Abschnitt erläutert werden. Jede Entität entspricht in der Regel eine eigene Tabelle.

2.3.1.2 Attribute

Attribute sind die Eigenschaften der Entität. Gehen wir von der Kundentabelle aus, dann können der Vornamen, der Nachnamen, Kunde seit entsprechenden Attributen sein. Attribute können unzerlegbar sein, können aber auch zusammengesetzt sein. Hierauf wird im Weiteren im Zusammenhang mit der Normalisierung nochmals eingegangen. Mit dem Attribut wird auch der Datentyp definiert. Ist es also ein Text oder eine Zahl und wie viele Stellen für das Feld vorgesehen sind. Die Eigenschaft, also das Attribut hat somit einen Namen, einen Wert und einen Datentyp.13

2.3.1.3 Relationship

Ein entscheidendes Element des ER-Modells sind die Beziehungen der Daten zueinander. Es gibt unterschiedliche Arten von Beziehungen. Die wichtigsten werden wie folgt dargestellt und erläutert14:

( 1:1 ) Bei der 1:1 Beziehung wird z.B. ein Verbrauchsartikel mit einer Lieferung verbunden. Jede Seite der Beziehung kann es hier nur einmal geben. Häufig gibt es aber mehr als einen Lieferanten für einen Artikel, sodass weitere Beziehungstypen notwendig werden.

( 1:n ) Mit der 1:n Beziehung werden Konstellationen dargestellt bei der auf der einen Seite z.B. eine Person mehrere Vorgänge z.B. Bestellungen auslösen kann. Die Person ist also einmalig. Bestellung können für eine Person häufiger auftauchen.

( m:n ) Die m:n Beziehung wird in Fällen eingesetzt, bei denen auf beiden Seiten mehrere Möglichkeiten bestehen. Bei Lieferaufträgen beispielsweise können auf der einen Seite mehrere Personen und auf der anderen Seite mehrere Artikel zum Tragen kommen. Wichtig ist bei m:n Beziehungen, dass diese in der Regel durch eine Hilfstabelle mit jeweils zwei 1:n Beziehungen aufgelöst werden. In diesem Beispiel würde man zwischen die Kunden und Artikel eine Auftragstabelle einsetzen. Siehe hierzu auch nochmals das Beispiel unter 2.3.1.5.

2.3.1.4 Schlüssel

Datensätze müssen eindeutig definiert sein. Es wird in der Regel für jede Entität ein Schlüssel vergeben. Dieser kann sich ergeben z.B. als fortlaufenden Rechnungsnummer oder Kundennummer. In manchen Fällen wird einfach fortlaufend und automatisch durchnummeriert, falls eine entsprechende Nummer nicht vorgesehen ist. Dies ist notwendig um Daten konsistent und eindeutig vorliegen zu haben.15

[...]


1Vgl. Piepmeyer (2011), S. 18

2Vgl. Statistisches Bundesamt (2021)

3Vgl. www.bigdata-insider.de (2015)

4Vgl. Gansor/Totok (2015), S. 1

5Vgl. Gansor/Totok (2015), S. 4

6Vgl. Gansor/Totok (2015), S. 13

7Vgl. Gansor/Totok (2015), S. 8

8Vgl. Krcmar (2015), S. 11

9Vgl. Piepmeyer (2011), S. 22

10Vgl. Krcmar (2015), S. 179

11Vgl. Eickler/Kemper (2011), S. 27

12Vgl. Piepmeyer (2011), S. 109 - 110

13Vgl. Piepmeyer (2011), S. 111

14Vgl. Piepmeyer (2011), S. 116 - 118

15Vgl. Eickler/Kemper (2011), S. 39

Details

Seiten
33
Jahr
2021
ISBN (PDF)
9783346596970
ISBN (Paperback)
9783346596987
Sprache
Deutsch
Institution / Hochschule
SRH Hochschule Riedlingen
Erscheinungsdatum
2022 (Februar)
Note
1
Schlagworte
BI DWH Data Datawarehouse SQL DBMS
Zurück

Titel: Herausforderung im effizienten Umgang mit Daten unter Berücksichtigung von unterschiedlichen Datenquellen