Das Ziel der Arbeit ist es, mit der Optical Character Recognition (OCR), eine Möglichkeit zur automatisierten Digitalisierung der Antragsdaten zu untersuchen. Dies ist eine Teillösung zur Digitalisierung des Beantragungsprozesses, die auf einen Prozess innerhalb der NRW.BANK fokussiert. Dabei wird die Funktionsweise der OCR erläutert und die Einbettung in den aktuellen Prozess beschrieben. Abschließend erfolgt eine Beurteilung des Einsatzpotentials von OCR für den untersuchten Prozess.
Eine Möglichkeit der aus Expertensicht angespannten bis sehr angespannten Lage auf dem Wohnungsmarkt in NRW entgegenzutreten, ist der preisgebremste öffentlich geförderte Wohnungsbau. Einkommensschwache Bauherren oder Investoren, die geförderten Mietwohnraum schaffen, erhalten dabei durch die landeseigene Förderbank NRW.BANK zinsverbilligte Darlehen und Zuschüsse. Die Beantragung eines solchen Förderdarlehens geschieht durch die jeweiligen Bauherren bei einer sogenannten Bewilligungsbehörde. Wenn die Voraussetzungen für eine Förderung gegeben sind, wird der Antrag bewilligt und die weitere Abwicklung des Darlehens von der NRW.BANK übernommen. Die Anträge werden papierhaft eingereicht und auch die Kommunikation zwischen Bauherren, Bewilligungsbehörde und NRW.BANK erfolgt papierbehaftet. Die Darlehensanträge werden postalisch an die Hauptniederlassung des Förderinstituts geschickt. In der aktuellen Pandemiesituation arbeiten viele Mitarbeiten aus dem Home-Office, haben also keinen Zugriff auf die Anträge, was die Bearbeitung verzögert.
Inhaltsverzeichnis
Abbildungsverzeichnis
Abkürzungsverzeichnis
1 Einleitung
1.1 Relevanz
1.2 Fragestellung und Zielsetzung
2 Optical Character Recognition (OCR)
2.1 Erklärung OCR
2.2 Funktionsweise OCR
3 Automatisierte Antragsdatenerfassung
3.1 Einordnung in den Gesamtprozess
3.2 Ist-Prozess Antragsdatenerfassung
3.3 Soll-Prozess Antragsdatenerfassung
4 Fazit
Literaturverzeichnis
Abbildungsverzeichnis
Abbildung 1: Förderkreditbeantragung (vereinfacht)
Abkürzungsverzeichnis
eEPK Erweiterte Ereignisgesteuerte Prozesskette
OCR Optical Character Recognition
1 Einleitung
1.1 Relevanz
Eine Möglichkeit der aus Expertensicht angespannten bis sehr angespannten Lage auf dem Wohnungsmarkt in NRW1 entgegenzutreten, ist der preisgebremste öffentlich geförderte Wohnungsbau.2 Einkommensschwache Bauherren oder Investoren, die geförderten Mietwohnraum schaffen, erhalten dabei durch die landeseigene Förderbank NRW.BANK zinsverbilligte Darlehen und Zuschüsse. Die Beantragung eines solchen Förderdarlehens geschieht durch die jeweiligen Bauherren bei einer sogenannten Bewilligungsbehörde. Wenn die Voraussetzungen für eine Förderung gegeben sind, wird der Antrag bewilligt und die weitere Abwicklung des Darlehens von der NRW.BANK übernommen. Die Anträge werden papierhaft eingereicht und auch die Kommunikation zwischen Bauherren, Bewilligungsbehörde und NRW.BANK erfolgt papierbehaftet. Die Darlehensanträge werden postalisch an die Hauptniederlassung des Förderinstituts geschickt. In der aktuellen Pandemiesituation arbeiten viele Mitarbeiten aus dem Home-Office, haben also keinen Zugriff auf die Anträge, was die Bearbeitung verzögert.
1.2 Fragestellung und Zielsetzung
Im Rahmen dieser Arbeit wird keine komplette Digitalisierung des Beantragungsprozesses, beispielsweise über ein Internetportal, beleuchtet. Dies erfolgt in der Hausarbeit des Verfassers. Mit der dort vorgestellten Komplettlösung wird eine vollständig digital Darlehensbeantragung und Kommunikation zwischen allen Akteuren möglich. Stattdessen ist es Zielsetzung dieser Arbeit, mit der Optical Character Recognition (OCR), eine Möglichkeit zur automatisierten Digitalisierung der Antragsdaten zu untersuchen. Dies ist eine Teillösung zur Digitalisierung des Beantragungsprozesses, die auf einen Prozess innerhalb der NRW.BANK fokussiert. Dabei wird die Funktionsweise der OCR erläutert und die Einbettung in den aktuellen Prozess beschrieben. Abschließend erfolgt eine Beurteilung des Einsatzpotentials von OCR für den untersuchten Prozess.
2 Optical Character Recognition (OCR)
2.1 Erklärung OCR
Unter Optical Character Recognition (OCR), was mit Texterkennung oder optische Zeichenerkennung übersetzt werden kann, wird eine Software, die Texte in Bildern in digitale Textformate umwandelt,3 verstanden. Das nun in digitaler Form vorliegende Textdokumente kann dann weiterverarbeitet und beispielsweise automatisiert in verschiedene Systeme eingefügt werden. Es wird zwischen online- und offline-Erkennung unterschieden.4 Bei der online-Erkennung, erfolgt die Übersetzung in Echtzeit während des Schreibprozesses, beispielsweise auf Tablets. Bei Letzterer wird ein vorhandener Text im Nachhinein digitalisiert und ggf. vorher aufbereitet. Da die genaue Erkennung von Texten über eine reine Mustererkennung oft fehlerbehaftet ist, da sich zum Beispiel der Buchstabe „O" schwer von der Zahl „0" unterscheiden lässt, kommt zusätzlich oft ein Algorithmus zum Einsatz, der den erkannten Text korrigiert. So wird beispielsweise künstliche Intelligenz in Form von neuronalen Netzen oder anderen Klassifizierungsverfahren eingesetzt,5 um die Zeichen richtig zu erkennen und die Fehlerrate zu senken.
2.2 Funktionsweise OCR
OCR lässt sich nach Chaudhuri et al. in acht Arbeitsschritte unterteilen. Zunächst wird ein Text in einem Bild eingescannt und das Dokument, wenn nötig, vorher bearbeitet, um es besser einscannen zu können. Der zweite Schritt ist die Standortsegmentierung. Dabei werden die Stellen im Dokument erkannt, die Text enthalten. Im dritten Schritt findet die Vorverarbeitung der Zeichen statt. Dabei wird das Rauschen, also Fehler oder Verunreinigungen im Dokument, reduziert, die Buchstaben normalisiert, also die Zeichen beispielsweise in Größe oder Stil standardisiert, und mit speziellen Verfahren komprimiert.6 Als nächstes werden bei der Segmentierung die einzelnen Zeichen, der im Bild enthaltenen Wörter, getrennt. Die Zeichendarstellung in Form von Pixeln, die bisher vorliegt, wird im Rahmen des fünften Schrittes in eine kompaktere und charakteristischere Form übertragen.7 Bei der folgenden Merkmalsextraktion werden Charakteristika der Zeichen gesucht und anhand dessen die Zeichen in Gruppen identischer Buchstaben und Zahlen eingeteilt. Im siebten Arbeitsschritt von OCR, Training und Erkennung, wird die eigentliche Zeichenerkennung durchgeführt. Die optischen Zeichenklassen im Bild werden durch Zuordnung zu vorgegeben Zeichenvektoren erkannt.8 Im letzten Schritt, der Nachbearbeitung, wird anhand der im vorherigen Schritt durchgeführten Zuordnung zwischen den Zeichenklassen im Scan und den digitalen Zeichen, der Text in digitaler Form rekonstruiert. Viele OCR-Algorithmen führen zusätzliche Korrekturlogiken aus, die fehlerhaft übersetzte Zeichen erkennen und verbessern.9
3 Automatisierte Antragsdatenerfassung
3.1 Einordnung in den Gesamtprozess
Der untersuchte, zu optimierende Prozess der Übertragung der Förderkreditantragsdaten in die Systeme der NRW.BANK soll folgend kurz in den Gesamtprozess der Förderkreditbeantragung eingeordnet werden. Der Beantragungsprozess ist in Abbildung 1 vereinfach dargestellt. Eine ausführliche Modellierung des Gesamtprozesses als eEPK wird in der Hausarbeit des Verfassers vorgenommen.
Abbildung 1: Förderkreditbeantragung (vereinfacht)
Abbildung in dieser Leseprobe nicht enthalten
Quelle: Eigene Darstellung
Der jeweilige Antragsteller beantragt den Förderkredit bei der zuständigen Bewilligungsbehörde. Dazu füllt er, ggf. gemeinsam mit der Behörde, den Kreditantrag aus. Nach einer ersten Prüfung durch die Bewilligungsbehörde wird der Antrag postalisch an die NRW.BANK zugestellt. Dort wird der Antrag erneut formal geprüft, ggf. ein Kreditvertrag aufgesetzt und anschließend die Bearbeitung des Darlehens, inklusive der Auszahlung vorgenommen. Im Rahmen dieser Arbeit wird der Antragsdatenerfassungsprozess innerhalb der NRW.BANK, auf der rechten Seite der Abbildung 1, untersucht. Die ebenfalls im Förderinstitut ausgeführte Bonitätsprüfung bei Mietinvestoren und die Darlehensbearbeitung sind nicht Teil des betrachteten Prozesses.
3.2 Ist-Prozess Antragsdatenerfassung
Aktuell werden die in der Logistikstelle der NRW.BANK ankommenden Förderkreditanträge per Hauspost an die Antragsdatenerfassung des Bereichs Wohnraumförderung weitergeleitet. Dort werden die Anträge eingescannt und in einem Dokumentenmanagementsystem abgelegt. Zudem werden die Antragsdaten in das Darlehensverwaltungssystem übertragen. Die Sachbearbeiter übernehmen dabei die Daten aus dem standardisierten Antrag ohne weitere Änderungen in das System. Es erfolgt auch eine Prüfung, ob alle erforderlichen Felder ausgefüllt sind. Eine inhaltliche Prüfung im Hinblick auf die Förderrechtlinien der Landesregierung wird, gemeinsam mit einer Bonitätsanalyse und der weiteren Darlehensabwicklung, zu einem späteren Zeitpunkt in der Abteilung Darlehensbearbeitung bzw. Bonitätsprüfung der Wohnraumförderung durchgeführt. Nach der Übernahme der Daten in das Darlehensverwaltungssystem ist der Prozess der Antragserfassung beendet.
Durch die manuelle Tätigkeit der Antragsdatenerfassung kann sich die weitere Bearbeitung des Antrags verzögern. Zudem ist gerade bei einfachen, manuellen Tätigkeiten ein gewisses Fehlerpotential, beispielsweise durch Tippfehler, vorhanden.10 Für die Mitarbeiter ist diese Arbeit außerdem wenig attraktiv, da sie eintönig ist. Hinzukommt, dass monotone und unterfordernde Tätigkeiten das Risiko eines sogenannten Boreouts, also einer psychischen Erkrankung, erhöhen.11
3.3 Soll-Prozess Antragsdatenerfassung
Um den beschriebenen Prozess der Digitalisierung der Antragsdaten zu automatisieren, könnte eine OCR-Software eingesetzt werden. Nach dem Eingang der Förderkreditanträge in der Logistikstelle der NRW.BANK werden die Anträge nicht mehr per Hauspost weitergeleitet, sondern in einer Erfassungsstrecke eingescannt. Nach der Ablage im Dokumentenmanagementsystem kann auf die digitalen Versionen der Förderkreditanträge dann eine OCR-Software angewendet werden. Diese transformiert die relevanten Stellen im Antrag in ein digitales Textformat. Da Standardanträge eingesetzt werden, sind die zu untersuchenden Stellen einfach einzugrenzen. Nach der Transformation des Textes werden die Antragsdaten automatisiert über eine Schnittstelle in das Darlehensverwaltungssystem übertragen. Sollte die Software nicht alle Daten erkennen, also beispielsweise die Wahrscheinlichkeit für die Klassifizierung eines Zeichens als „3" bzw. „8" ähnlich hoch sein, wird der Scann des Förderkreditantrags zusammen mit dem Vorschlag der OCR-Software an einen Sachbearbeiter weitergeleitet. Dieser entscheidet dann, welche Zeichen vorliegen. Die im Ist-Prozess durch den Sachbearbeiter vorgenommene Prüfung der formalen Vollständigkeit kann ebenfalls durch die Software vorgenommen werden. Eine grobe Orientierung für die Funktionsweise des Soll-Prozesses kann dabei die in Geschäftsbanken - also nicht in der NRW.BANK - vorgenommene automatische Verarbeitung von Checks und Überweisungsträgern geben, bei der oft die OCR-Technologie zum Einsatz kommt.12 Nach der Datenerfassung wird der Antrag, genauso wie im bisherigen Prozess, weiter durch die Abteilungen Darlehensbearbeitung und Bonitätsprüfung behandelt.
[...]
1 Vgl. Kloth, M., Wohnungsmarktbarometer, 2019, S. 1.
2 Vgl. Lohse, E., Lösungsansatz, 2016, S. 8.
3 Vgl. Shinde, A. & Chougule, D., Definition, 2012, S. 1.
4 Vgl. Berchmanns, D. & Kumar, S., Online/Offline, 2014, S. 1.
5 Vgl. Patel, D, Som, T, Yadav, S. & Sing, M., KI, 2012, S. 210.
6 Vgl. Chaudhuri, A, Mandaviya, K., Badelia, P. & Gosh, S., Funktionsweise, 2016, S. 17ff.
7 Vgl. Chaudhuri, A., Mandaviya, K., Badelia, P. & Gosh, S., Funktionsweise, 2016, S. 23f.
8 Vgl. Patel, D., Som, T., Yadav, S. & Sing, M., KI, 2012, S. 211f.
9 Vgl. Chaudhuri, A, Mandaviya, K., Badelia, P. & Gosh, S., Funktionsweise, 2016, S. 34.
10 Vgl. Hölzle, K. et. al., Fehleranfälligkeit, 2019, S. 144.
11 Vgl. Prammer, E, Boreout, 2013, S. 17.
12 Vgl. Mithe, R., Indalkar, S. & Divekar, N., Überweisungsträgerverarbeitung, 2013, S. 74.