Lade Inhalt...

Kombinationsprognose mit neuronalen Netzen

©2011 Bachelorarbeit 53 Seiten

Zusammenfassung

Das Erstellen präziser Prognosen ist in der heutigen Zeit unverzichtbar, da vielerlei Planungsaktivitäten der Wirtschaft, Finanzwelt und Wissenschaft Vorhersagen über das zukünftige Verhalten von Variablen und Zeitreihen benötigen. Diese Vorhersagen unterstützen die strategischen Entscheidungen von Organisationen, welche dadurch ein erhebliches praktisches Interesse an Prognoseverfahren haben. Aufgrund der Existenz einer Unzahl von Interdependenzen und ständiger Veränderungen ist es jedoch gerade im Bereich der Wirtschaft zunehmend schwieriger akkurate Vorhersagen zu treffen. Das Bestimmen von Prognosen und anschließende darauf basierte Treffen von Entscheidungen kann für Unternehmen daher sowohl Chancen als auch Risiken bergen. Aufgrund der großen praktischen Bedeutung von Prognosen ist die Entwicklung und Verbesserung von Methoden der Prognoseerstellung ein aktives und stark verbreitetes Forschungsgebiet, welches auch in aktueller Literatur viel Beachtung findet. Insbesondere vor dem Hintergrund gestiegener Volatilitäten im wirtschaftlichen Umfeld und den immer stärkeren globalen Verflechtungen gewinnen die Anforderungen an moderne Prognosesysteme am Bedeutung. Eine dieser modernen Prognosemethoden ist die Methode der Prognose mithilfe künstlicher neuronaler Netzwerke, welche seit dem Ende der achtziger Jahre neben den konventionellen Prognoseverfahren zunehmend Anwendung findet. Künstlich neuronale Netzwerke sollten ursprünglich die Erforschung von Vorgängen im menschlichen Gehirn unterstützen. Mittlerweile werden neuronale Netze jedoch in einer Vielzahl von Anwendungsgebieten wie der Optimierung, der Klassifizierung und auch der Prognose, erfolgreich eingesetzt. Die Nutzung von neuronalen Netzen zur Erstellung von Prognosen bringt jedoch auch eine Reihe von Problemen mit sich. Werden bei der Auswahl von Faktoren, die es im Prozess der Prognoseerstellung mithilfe von künstlichen neuronalen Netzwerken zu bestimmen gilt, suboptimale Entscheidungen getroffen, kann sich dies stark negativ auf die Prognosegüte auswirken. Eine Methode, welche diesen Problemen entgegenwirken soll, ist die Kombination mehrerer neuronaler Netzwerke zu einem Ensemble. Mit dieser Methode, die im Laufe des letzten Jahrzehnts immer stärker werdende Aufmerksamkeit bekommen hat, soll die Gefahr von groben Fehleinschätzungen verringert sowie auch die generell erreichbare Prognosegüte stark verbessert werden.

Leseprobe

Inhaltsverzeichnis

1 Einleitung
1.1 Themenvorstellung und Zielsetzung
1.2 Gang der Arbeit

2 Konventionelle Prognoseverfahren
2.1 Naive Verfahren
2.2 Qualitative Verfahren
2.3 Quantitative Verfahren
2.3.1 Zeitreihenprognose
2.3.2 Kausale Prognoseverfahren

3 Künstliche neuronale Netze
3.1 Aufbau und Funktionsweise künstlicher neuronaler Netze
3.1.1 Das Neuron
3.1.2 Die Netzwerktopologie
3.2 Der Lernvorgang künstlicher neuronaler Netzwerke
3.2.1 Der Backpropagation-Algorithmus

4 Prognose mithilfe künstlicher neuronaler Netze
4.1 Eigenschaften künstlicher neuronaler Netze in Bezug auf die Prognose
4.1.1 Datengetrieben und selbst anpassend
4.1.2 Generalisierbarkeit
4.1.3 Abbildbarkeit jeder kontinuierlichen Funktion
4.1.4 Nichtlinearität
4.2 Anwendungsgebiete
4.3 Prozess der Prognoseerstellung
4.4 Zeitreihenmodellierung durch ein MLP - Netz
4.5 Limitationen des KTB Ansatzes

5 Kombination künstlicher neuronaler Netze zur Prognoseerstellung
5.1 Die Erstellung variierender Netzwerke
5.1.1 Variation der Startwerte
5.1.2 Variation der Topologien
5.1.3 Variation bzw. Manipulation der Trainingsdaten
5.2 Die Kombination der Netzwerke
5.2.1 Die einfache Durchschnittsbildung
5.2.2 Die gewichtete Durchschnittsbildung
5.2.3 Die Größe des NNE
5.3 Gegenüberstellung der Verfahren der Kombinationsprognose

6 Fazit und Ausblick

Literaturverzeichnis

Abbildungsverzeichnis:

Abb. 1: Aufbau der Arbeit

Abb. 2: Trendfunktionen

Abb. 3: Aufbau eines Neurons

Abb. 4: Sigmoide (logistische) Aktivierungsfunktion

Abb. 5: Beispieltopologie

Abb. 6: Fehlergebirge E mit zwei freien Parametern

Abb. 7: Problem des Gradientenabstiegsverfahren

Abb. 8: Beispiele der Prognoseeinsatzgebiete

Abb. 9: Prognosefehler im Verhältnis zu Trainingsdurchläufen

Abb. 10: MLP - Netzwerk zur Zeitreihenprognose

Abb. 11: Wechselkurs British Pound vs. US Dollar

Abb. 12: Systematische Partitionierung mit 3-dimensionalen Eingabevektoren

Abb. 13: Tatsächliche und mögliche Realisationen von Zeitreihenwerten

Abb. 14: Neural Network Ensemble

Abb. 15: Prognosegüte im Verhältnis zur Ensemble-Größe

1 Einleitung

1.1 Themenvorstellung und Zielsetzung

Das Erstellen präziser Prognosen ist in der heutigen Zeit unverzichtbar, da vielerlei Planungsaktivitäten der Wirtschaft, Finanzwelt und Wissenschaft Vorhersagen über das zukünftige Verhalten von Variablen und Zeitreihen benötigen. Diese Vorhersagen unterstützen die strategischen Entscheidungen von Organisationen, welche dadurch ein erhebliches praktisches Interesse an Prognoseverfahren haben (Wong, Xia, & Chu, 2010, S. 807). Aufgrund der Existenz einer Unzahl von Interdependenzen und ständiger Veränderungen ist es jedoch gerade im Bereich der Wirtschaft zunehmend schwieriger akkurate Vorhersagen zu treffen. Das Bestimmen von Prognosen und anschließende darauf basierte Treffen von Entscheidungen kann für Unternehmen daher sowohl Chancen als auch Risiken bergen (Homburg, 2000, S. 102). Aufgrund der großen praktischen Bedeutung von Prognosen ist die Entwicklung und Verbesserung von Methoden der Prognoseerstellung ein aktives und stark verbreitetes Forschungsgebiet, welches auch in aktueller Literatur viel Beachtung findet (Zhang G. P., 2007, S. 5329). Insbesondere vor dem Hintergrund gestiegener Volatilitäten im wirtschaftlichen Umfeld und den immer stärkeren globalen Verflechtungen gewinnen die Anforderungen an moderne Prognosesysteme am Bedeutung. Eine dieser modernen Prognosemethoden ist die Methode der Prognose mithilfe künstlicher neuronaler Netzwerke, welche seit dem Ende der achtziger Jahre neben den konventionellen Prognoseverfahren zunehmend Anwendung findet (Hamzaçebi, 2008, S. 4550). Künstlich neuronale Netzwerke, welche von ihrem Aufbau her der Funktionsweise des Gehirns eines Säugetieres nachempfunden wurden, sollten ursprünglich die Erforschung von Vorgängen im menschlichen Gehirn unterstützen. Mittlerweile werden neuronale Netze jedoch in einer Vielzahl von Anwendungsgebieten wie der Optimierung, der Klassifizierung und auch der Prognose, erfolgreich eingesetzt. Die Nutzung von neuronalen Netzen zur Erstellung von Prognosen bringt jedoch auch eine Reihe von Problemen mit sich. Werden bei der Auswahl von Faktoren, die es im Prozess der Prognoseerstellung mithilfe von künstlichen neuronalen Netzwerken zu bestimmen gilt, suboptimale Entscheidungen getroffen, kann sich dies stark negativ auf die Prognosegüte auswirken. Eine Methode, welche diesen Problemen entgegenwirken soll, ist die Kombination mehrerer neuronaler Netzwerke zu einem Ensemble. Mit dieser Methode, die im Laufe des letzten Jahrzehnts immer stärker werdende Aufmerksamkeit bekommen hat, soll die Gefahr von groben Fehleinschätzungen verringert sowie auch die generell erreichbare Prognosegüte stark verbessert werden.

Ziel dieser Arbeit ist es, verschiedene in der Wissenschaft und Praxis verwendete Methoden der Prognoseerstellung durch die sogenannten Neural Network Ensembles zu beschreiben und anschließend zu bewerten. Eine der zentralen Fragestellungen, die es in diesem Themengebiet zu beantworten gibt, kann folgendermaßen formuliert werden:

Erhöht die Kombination mehrerer künstlicher neuronaler Netzwerke zu einem Ensemble die erreichbare Prognosequalität oder stellt das Kombinieren mehrerer Netzwerke einen zwecklosen und damit unwirtschaftlichen Mehraufwand an Zeit und Ressourcen dar?

1.2 Gang der Arbeit

Die vorliegende Arbeit untergliedert sich in fünf Teile, drei theoretische und einen stärker praktisch orientierten sowie eine Schlussbetrachtung.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Aufbau der Arbeit

Nachdem im vorangegangen Abschnitt das Thema sowie die Zielsetzung der Arbeit vorgestellt wurden, wird in Kapitel 2 zunächst eine grundlegende Einführung in die Thematik der Prognoseerstellung gegeben. Im Zuge dieser Einführung werden wichtige konventionelle Prognoseverfahren vorgestellt. Im Anschluss an die Vorstellung der konventionellen Prognoseverfahren soll das hier schwerpunktmäßig betrachtete Prognoseverfahren durch künstliche neuronale Netzwerke analysiert werden. Hierfür soll in Kapitel 3 zunächst eine generelle Einführung in den Aufbau und in die Funktionsweise eines künstlichen neuronalen Netzwerkes gegeben werden. Im Anschluss daran soll in Kapitel 4 explizit auf die Prognoseerstellung mithilfe künstlicher neuronaler Netzwerke eingegangen werden, wobei sich hierfür auf die Erkenntnisse aus dem vorangegangen Kapitel bezogen werden soll. In Kapitel 5, welches den Hauptteil dieser Arbeit darstellen soll, wird zunächst auf die Probleme der Prognoseerstellung mithilfe eines einzelnen neuronalen Netzwerkes eingegangen. Anschließend wird als Lösungsansatz dieser Probleme die Kombination mehrerer neuronaler Netzwerke zu einem Neural Network Ensemble betrachtet. Hierfür sollen wichtige in der Wissenschaft und Praxis verbreitete Methoden der Prognose durch Neural Network Ensembles analysiert und anhand von Ergebnissen aus relevanten Studien empirisch bewertet werden. In Kapitel 6 soll eine abschließende Betrachtung sowie ein Ausblick über die mögliche Entwicklung der in dieser Arbeit besprochenen Thematik gegeben werden.

2 Konventionelle Prognoseverfahren

Während der Schwerpunkt dieser Arbeit auf die Prognoseerstellung mithilfe künstlicher neuronaler Netze gesetzt werden soll, wird zunächst ein kurzer Überblick über konventionelle Prognoseverfahren gegeben. Dies soll zum einen den generellen Einstieg in die Thematik der Prognoseerstellung gewähren und einen Überblick über in der Praxis verbreitete Methoden geben. Zum anderen ermöglicht es auch eine Abgrenzung der im Folgenden beschriebenen konventionellen Prognoseverfahren von solchen Verfahren, bei denen künstliche neuronale Netze verwendet werden.

Unter einer Prognose versteht man das Vorhersagen zukünftiger Ereignisse aufgrund von Vergangenheitsinformationen, indem einem betrachteten Prozess ein bestimmtes Modell explizit unterstellt wird. Verschiedene Modelle lassen sich durch unterschiedliche Prognoseverfahren abbilden. Trifft das postulierte Modell nicht zu oder ändert es sich im Verlaufe der Zeit, verliert die Prognose ihre Gültigkeit (Schlittgen & Streitberg, 2001, S. 191). Zur Bewertung einer Prognose wird der Prognosewert mit dem wahren Zielwert verglichen. Zur Quantifizierung der Prognosegüte gibt es eine Reihe von Fehlermaßen. Wichtige in der Wissenschaft und Praxis verwendeten Fehlermaße sind der Mean Squared Error (MSE), Root Mean Squared Error (RMSE) und der Mean Absolute Error (MAE). Die Berechnung der jeweiligen Fehlermaße erfolgt durch folgende Formeln (Zhang G. P., 2007, S. 5335):

Abbildung in dieser Leseprobe nicht enthalten

Hierbei stellt den Zielwert und den Prognosewert der Periode dar und die Anzahl der prognostizierten Perioden.

Wichtige konventionelle Prognoseverfahren sollen im Folgenden vorgestellt werden. Allgemein lassen sich die Verfahren in drei verschiedene Klassen unterteilen (Homburg, 2000, S. 103):

- naive Verfahren
- qualitative Verfahren
- quantitative Verfahren

2.1 Naive Verfahren

Naive Verfahren stellen hierbei die einfachsten Verfahren der Prognostizierung dar. Der Prognosewert wird rein schematisch ermittelt. Dies geschieht zum Beispiel durch die Übertragung des Wertes der Vorperiode als Prognosewert für die nächste Periode

Abbildung in dieser Leseprobe nicht enthalten

oder durch die Hinzunahme einer zeitlich konstanten Zuwachsrate, sodass sich folgende Formel ergibt (Homburg, 2000, S. 103):

Abbildung in dieser Leseprobe nicht enthalten

2.2 Qualitative Verfahren

Qualitative Verfahren verfügen im Gegensatz zu den quantitativen Verfahren nicht über ein mathematisches Modell, sondern nutzen das Wissen und die Erfahrung von Experten, um eine Prognose zu erstellen (Bruhn, 2010, S. 122). Da diese Arbeit sich schwerpunktmäßig mit der mathematischen und datengetriebenen Prognose befasst, soll im Folgenden nur kurz auf die wichtigsten qualitativen Verfahren eingegangen werden.

Die wichtigsten und in der Praxis am meisten genutzten qualitativen Prognosetechniken sind (Bruhn, 2010, S. 122):

- die Expertenbefragung
- die Delphi-Methode
- die Szenario-Technik

Im Rahmen der Expertenschätzung werden sachkundige Personen (z.B. Außendienstmitarbeiter, Einkäufer im Handel, Unternehmensberater) (Bruhn, 2010, S. 122) um die Einschätzung einer zukünftigen Situation oder Entwicklung gebeten. Diese in der Praxis weit verbreitete Methode ist vor allem deshalb sehr beliebt, da sie sowohl vielseitig anwendbar als auch frei von methodischem Aufwand ist (Preißner, 2008, S. 167).

Die Delphi-Methode ist eine besondere Form der Expertenbefragung (Bruhn, 2010, S. 122). Hierbei werden mehrere Experten, meist aus verschiedenen Fachgebieten, in die Prognoseerstellung mit einbezogen. Dazu werden sämtliche Teilnehmer dazu aufgefordert, für die zu prognostizierende Größe eine Vorhersage zu treffen. Dies geschieht meist schriftlich, damit sich die Teilnehmer untereinander nicht vorab durch sozialpsychologische Effekte in ihrer Vorhersage beeinflussen (Kühl, Strodtholz, & Taffertshofer, 2009, S. 464). Anschließend wird ein Mittelwert aus allen eingegangen Schätzungen errechnet. Jeder Teilnehmer erhält die Auswertung und wird anschließend dazu aufgefordert, mit dem Wissen des Mittelwertes seine vorher getroffene Aussage zu begründen beziehungsweise zu korrigieren. So kann der Mittelwert (häufig in mehreren Schritten) angepasst werden (Preißner, 2008, S. 170).

Die Szenario-Technik als drittes qualitatives Prognoseverfahren ist ein Verfahren, bei dem die Grundüberlegung darin besteht, Einflussgrößen des betrachteten Prozesses zu identifizieren und die genauen Auswirkungen dieser Größen zu beschreiben. In einem nächsten Schritt wird dann zum einen ein optimistisches Szenario entworfen, bei dem sich alle Einflussgrößen positiv entwickeln und zum anderen ein pessimistisches Szenario, bei dem die Einflussgrößen eine gegenläufige Entwicklung erfahren. In einem letzten Schritt werden die beiden Extremszenarien einander gegenübergestellt. Dies wird getan, um die gesamte Spannbreite der möglichen Entwicklung der gesuchten Prognosegröße darzustellen (Bruhn, 2010, S. 122) und um als Mittelwert dieser Extrema das Trendszenario zu ermitteln (Kleinaltenkamp, 2002, S. 106).

2.3 Quantitative Verfahren

Bei quantitativen Prognoseverfahren werden zu prognostizierende Größen mithilfe mathematischer Funktionsverläufe errechnet. Im Bereich der quantitativen Methoden unterscheidet man zwischen Zeitreihenprognosen und kausalen Verfahren (Bruhn, 2010, S. 118).

2.3.1 Zeitreihenprognose

Bei Zeitreihenprognosen werden bekannte Zeitreihendaten aus vorherigen Perioden als Grundlage für die Vorhersage der Werte zukünftiger Perioden genommen (Bruhn, 2010, S. 118), ohne dass zusätzlich echte kausale Zusammenhänge beachtet werden. Diese Modelle lassen sich in der Form

Abbildung in dieser Leseprobe nicht enthalten

darstellen. stellt hierbei den Prognosewert der Periode und die Prognosefunktion in Abhängigkeit vorheriger Werte dar (Homburg, 2000, S. 104). Die Schwierigkeit bei der Anwendung von Zeitreihenprognosen liegt im Erkennen der den Zeitreihen zugrunde liegenden Strukturen, wie zum Beispiel Trends, saisonalen Schwankungen, Kalenderkomponenten und Zufällen (Winker, 2010, S. 223) (Homburg, 2000, S. 104). Wichtige und in der Praxis verbreitete Methoden der Zeitreihenprognosen sind unter anderem die folgenden Methoden (Homburg, 2000, S. 104):

- Gleitende Durchschnitte
- Exponentielle Glättung
- Trendextrapolation

Bei dem Verfahren der gleitenden Durchschnitte wird davon ausgegangen, dass die zu prognostizierende Größe im Wesentlichen konstant ist, sodass Schwankungen ausschließlich als Zufälle angesehen werden. Die wesentliche Aufgabe des Verfahrens ist somit, einen von Zufallsschwankungen bereinigten Basiswert der Zeitreihe zu ermitteln. Zur Erstellung der Prognose für Periode werden die letzten Periodenwerte in der Form

Abbildung in dieser Leseprobe nicht enthalten

verwendet (Homburg, 2000, S. 105). Hierbei liegt die Schwierigkeit darin, einen geeigneten Wert für zu wählen. Bei einem zu kleinem Wert für haben Zufallsschwankungen einen zu starken Einfluss und bei zu großem erfolgen Reaktionen auf Veränderungen des Basiswertes von zu langsam (Homburg, 2000, S. 105). Um dieses Problem zu umgehen wurde das Verfahren der exponentiellen Glättung als Weiterentwicklung des Verfahrens der gleitenden Durchschnitte entwickelt. In diesem Verfahren werden eine Vielzahl von Werten in die Prognose einbezogen, wobei jedoch neuere Werte mit einer stärkeren Gewichtung als ältere Werte in die Prognose einfließen. Dies führt zu einer erhöhten Flexibilität des Verfahrens (Preißner, 2008, S. 175). Mit dem Glättungsparameter ergibt sich folgende Beziehung zwischen dem Prognosewert und den bekannten Zeitreihenwerten (Homburg, 2000, S. 106):

Abbildung in dieser Leseprobe nicht enthalten

Bei der Trendextrapolation wird ein regressionsanalytischer Ansatz gewählt. Der zu prognostizierenden Zeitreihe wird eine bestimmte Trendfunktion unterstellt, bei der ausschließlich die Zeit als unabhängige Variable fungiert. Somit lassen sich für beliebige zukünftige Perioden Prognosewerte ermitteln (Homburg, 2000, S. 107). Die Trendfunktion kann neben einer linearen Funktion

Abbildung in dieser Leseprobe nicht enthalten

auch beispielsweise einen exponentiellen oder logistischen Trend abbilden (Bruhn, 2010, S. 119):

Abbildung in dieser Leseprobe nicht enthalten

bzw.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2: Trendfunktionen (Bruhn, 2010, S. 119)

Sämtliche Zeitreihenprognosen unterstellen, dass in der Vergangenheit vorgefundene Strukturen der Zeitreihe unverändert auf in der Zukunft liegende Perioden übertragen werden können. Existieren jedoch Einflussfaktoren, welche die Ausprägung der zu prognostizierenden Größe beeinflussen, liefern Zeitreihenprognosen keine adäquaten Ergebnisse mehr. In diesem Fall müssen kausale Verfahren verwendet werden (Homburg, 2000, S. 109).

2.3.2 Kausale Prognoseverfahren

Zur Verwendung kausaler Verfahren müssen kausale Zusammenhänge zwischen einer oder mehreren unabhängigen Variablen und der zu prognostizierenden (abhängigen) Größe definiert werden (Leonhart, 2009, S. 301). Anschließend kann mithilfe der unabhängigen Variablen die gesuchte abhängige Variable prognostiziert werden. Je nachdem, ob bei dem kausalen Verfahren eine oder mehrere unabhängige Variablen zur Ermittlung der Prognose einbezogen werden, spricht man von der einfachen (meist linearen) oder multiplen Regression (Preißner, 2008, S. 175). Die Grundform einer einfachen linearen Regression hat die Form

Abbildung in dieser Leseprobe nicht enthalten

wobei die prognostizierte Größe (abhängige Variable) und die unabhängige Variable darstellt. Die Formel stellt eine Gerade dar, bei der die Parameter und so gewählt werden müssen, dass die Gerade möglichst genau den Zusammenhang zwischen und abbildet. Die Ermittlung der Parameter erfolgt so, dass die Summe der Abstände in y-Richtung zum Quadrat zwischen bekannten Punktepaaren vergangener Daten und der Regressionsgrade minimiert wird. Die Forderung der Methode der kleinsten Quadrate (OLS – Ordinary Least Squares) wird somit durch folgende Formel dargestellt (Preißner, 2008, S. 171):

Abbildung in dieser Leseprobe nicht enthalten

Neben der linearen Korrelation lassen sich mithilfe der nichtlinearen Regression auch nichtlineare Zusammenhänge abbilden. Diese können unter anderem folgender Natur sein (Preißner, 2008, S. 174):

- logarithmisch:
- exponentiell:
- potentiell:

Des Weiteren kann für die multiple Regression auch in Abhängigkeit mehrerer unabhängiger Variablen beispielsweise folgende Abhängigkeit dargestellt werden (Preißner, 2008, S. 174):

- polynomisch:

Während sich die Ermittlung der Parameter im Falle der linearen Regression mit simplen Formeln als sehr einfach gestaltet (Bruhn, 2010, S. 112), ist die Berechnung im Falle der nichtlinearen Regression ungleich schwerer und muss beispielsweise mithilfe von Tabellenkalkulationsprogrammen (iterativen Verfahren) vorgenommen werden (Preißner, 2008, S. 174).

Ein weiteres, wichtiges quantitatives Verfahren der Prognoseerstellung, welches vor allem in den letzten Jahren stark an Bedeutung gewonnen hat, ist das Verfahren der Prognoseerstellung mithilfe von künstlichen neuronalen Netzwerken (Wong, Xia, & Chu, 2010, S. 807). Im Folgenden soll zur Beschreibung dieses Verfahrens zunächst ein genereller Überblick über den Aufbau und die Funktion künstlicher neuronaler Netzwerke gegeben werden, bevor im darauf anschließenden Kapitel auf das eigentliche Verfahren der Prognoseerstellung eingegangen wird.

3 Künstliche neuronale Netze

Ein künstliches neuronales Netzwerk ist ein System zur Informationsverarbeitung, welches von seinem Aufbau und seiner Funktionsweise her dem eines Neuronennetzes im Gehirn eines Säugetieres nachempfunden wurde. Ursprünglich wurden künstliche neuronale Netzwerke dazu entwickelt, Abläufe im menschlichen Gehirn besser zu verstehen. Mittlerweile werden sie jedoch in einer Vielzahl von Bereichen zur Modellierung, Klassifizierung und Erstellung von Prognosen verwendet. Als typische Anwendungsbereiche sind hier beispielsweise die Prognose von Wirtschaftsdaten, die Kontrolle von Fertigungsprozessen, die Vorhersage von Devisenkursen sowie die medizinische Diagnostik zu nennen (Oberhofer & Zimmerer, 1996, S. 3) (Fink & Siebe, 2006, S. 252). Der beschriebene Anwendungsbereich der neuronalen Netzwerke soll sich in dieser Arbeit jedoch auf die Erstellung von Prognosen beschränken.

Ein neuronales Netzwerk besteht aus vielen einzelnen parallel arbeitenden Verarbeitungseinheiten, den Neuronen. Die Funktion eines Netzwerkes ist bestimmt durch dessen Netzwerkstruktur, den Verbindungsstärken der einzelnen Neuronen sowie der Informationsverarbeitung der einzelnen Neuronen (Naim & Davalo, 1989, S. 60). Die Struktur des Netzwerkes bezieht sich hierbei auf die Art und Weise, auf die einzelne Neuronen innerhalb des Netzwerkes miteinander verbunden sind und die Verbindungsstärke auf die Stärke und Richtung, in der Signale von einem zum nächsten Neuron weitergegeben werden (Bezdek, Keller, Krisnapuram, & Pal, 1999, S. 378).

In Bezug auf die Prognoseerstellung gibt es fundamentale Unterschiede zwischen konventionellen Prognoseverfahren und der Prognose mithilfe künstlicher neuronaler Netzwerke. Zum einen sind die neuronalen Netze im Gegensatz zu konventionellen Methoden, welche stets auf Modelle oder Algorithmen basieren, rein datengetrieben (Wong, Xia, & Chu, 2010, S. 807). Das bedeutet, dass die neuronalen Netzwerke alleine anhand von Beispielen in Form vorhandener Datensätze lernen, funktionale Zusammenhänge erkennen und diese in den Prozess der Prognoseerstellung implementieren. Dies hat zum einen die Folge, dass keinerlei kausale Zusammenhänge über die zu prognostizierten Daten vorliegen müssen, zum anderen aber auch, dass ein neuronales Netzwerk vor dem eigentlichen Gebrauch immer eine Lernphase durchlaufen muss. Das wiederum erfordert, dass stets eine ausreichende Menge an relevanten Daten für das Training der Netzwerke vorliegen muss (Zhang, Patuwo, & Hu, 1998, S. 35). Des Weiteren sind künstliche neuronale Netzwerke in der Lage, in Bezug auf die Zeitreihenprognose auch dann sehr gute Ergebnisse zu erzielen, wenn die vorliegenden Daten starkes Rauschen aufweisen (Wong, Xia, & Chu, 2010, S. 807). Diese besonderen Eigenschaften machen künstliche neuronale Netzwerke zu einer wichtigen und in der Praxis mittlerweile weit verbreiteten Alternative zu den herkömmlichen modellorientierten Prognoseverfahren .

3.1 Aufbau und Funktionsweise künstlicher neuronaler Netze

Wie bereits beschrieben, werden künstliche neuronale Netze stets durch folgende Komponenten charakterisiert (Scherer, 1997, S. 45):

- Verarbeitungseinheiten (Neuronen)
- Gerichtete Verbindungen zwischen den Neuronen
- Die Netzwerktopologie (räumliche Struktur des Netzes)

3.1.1 Das Neuron

Die einzelnen Neuronen bilden die Grundbausteine eines jeden künstlichen neuronalen Netzwerkes. Jedes Neuron kann numerische Daten mithilfe von Eingangsleitungen aufnehmen und an Ausgangsleitungen abgeben. Die aufgenommenen Eingangswerte sind entweder die Ausgabewerte verbundener Neuronen oder dem neuronalen Netzwerk zugeführte Information aus der Systemumgebung (Strecker, 1997, S. 12f), (Crone, 2010, S. 167).

Die Verbindungen zwischen zwei Neuronen und sind jeweils individuell durch einen bestimmten numerischen Wert gewichtet. Diese Gewichtung bestimmt die Stärke von Signalen, die von einem zum nächsten Neuron übertragen werden.

Die eigentliche Informationsverarbeitung erfolgt innerhalb der Neuronen, indem sie aus den erhaltenen Eingabewerten, dem Input, mithilfe von Funktionen einen neuen Ausgabewert, den Output, produzieren. Dieser Prozess der Ermittlung der Ausgabewerte lässt sich in drei Schritte unterteilen (Oberhofer & Zimmerer, 1996, S. 7):

Zu Beginn ermittelt das Neuron mithilfe der Propagierungsfunktion den erhaltenen Netto-Input. Anschließend wird in einem zweiten Schritt mithilfe der Aktivierungsfunktion der Aktivierungswert berechnet. In einem dritten Schritt wird der über den Aktivierungswert ermittelte Aktivierungszustand des Neurons mithilfe der Ausgabefunktion zum Ausgangssignal transformiert.

[...]

Details

Seiten
Jahr
2011
ISBN (eBook)
9783656237570
ISBN (Paperback)
9783656239154
DOI
10.3239/9783656237570
Dateigröße
2.2 MB
Sprache
Deutsch
Institution / Hochschule
Universität Hamburg
Erscheinungsdatum
2012 (Juli)
Note
1,7
Schlagworte
Künstliche neuronale Netzwerke Quantitative Prognose Kombinationsprognose Prognoseverfahren KNN Neural Network Ensembe Artificial neural Networks
Zurück

Titel: Kombinationsprognose mit neuronalen Netzen