Tech Updates

Published on Jun 28, 2022

Wie man mit intelligenter Dokumentenverarbeitung 500 Personentage pro Jahr einsparen kann

1. Wiederholung: Cloudflight AI Patterns

Wir haben beobachtet, dass Künstliche Intelligenz von vielen bereits als Schlüsseltechnologie gesehen wird. Der tatsächliche Einsatz in den Unternehmen bzw. die aktuell begonnenen oder geplanten Einführungsprojekte spiegeln dies jedoch noch nicht wider. Als Gründe dafür werden häufig Budgets oder Zeitmangel genannt, was eine einseitige Betrachtung ist und nicht die Nutzen- und Potentialseite berücksichtigt.

Die Cloudflight AI Patterns helfen, die Potentiale von KI in spezifischen Unternehmen systematisch sichtbar zu machen, aufzuarbeiten und zu bewerten. Ein einzelnes Pattern ist dabei ein Einsatzmuster einer speziellen KI-Technologie welches ein relativ fein granulares Problem löst, wie etwa den Typ eines Dokuments zu erkennen (Bestellung, Rechnung, Lieferschein, etc…). Der Nutzen ergibt sich dann aus dem übergeordneten Use Case und dem Beitrag, der dort als Baustein geleistet wird.

 

2. Fallstudie: Intelligente Dokumentenverarbeitung

Um das Vorgehen anschaulicher zu machen, stellen wir ein konkretes Pattern und seine Anwendung in einem spezifischen Unternehmenskontext näher vor. Bei der Wahl des Patterns haben wir uns für sowie die entsprechenden Sub-Patterns entschieden. Grundlage dafür war die breite Anwendbarkeit dieses Patterns, da Dokumente allgegenwärtig sind und so gut wie alle Unternehmensprozesse begleiten.

Als Unternehmen stellen wir uns einen großen mittelständischen Produktionsbetrieb mit mehreren Standorten vor. Fiktiv werden täglich 1000 Anlieferungen an diverse Anlaufstellen durchgeführt.

Der Prozess dahinter sieht vereinfacht so aus, dass der jeweilige Lieferschein als erstes digitalisiert wird. Das passiert, indem Lieferscheine nach Warenübernahme und -kontrolle abgestempelt, in einer Ablage gesammelt und von dort an eine zentrale Stelle pro Niederlassung gebracht werden. Hier erfolgt das Scannen der Scheine und Speichern der Scans in einem Eingangsordner pro Niederlassung.

Auf Grundlage der nun digitalen Lieferscheine erfolgt eine manuelle Zuordnung des Lieferscheins zu der entsprechenden Bestellung im Softwaresystem. Dazu wird jedes Dokument geöffnet, und die Daten anhand einfacher Suchkriterien wie Bestellnummer, Lieferant oder Warenbezeichnung mit den offenen Bestellungen abgeglichen. Der genaue Arbeitsablauf richtet sich oft nach der Erfahrung der Einzelpersonen, die gesuchte Bestellung bereits mit möglichst wenig getippten Zeichen gut genug einzuschränken, sodass die entsprechende Übereinstimmung aus der verbleibenden Liste leicht erkennbar ist.

In weiterer Folge dieses Abgleichs werden Positionen und Mengen auf Vollständigkeit geprüft und bei Teillieferungen die jeweiligen Mengen eingetragen. Zur späteren Nachvollziehbarkeit wird der gescannte Lieferschein mit der so angelegten (Teil-)Lieferung hinterlegt und zentral gespeichert.

Diese auf diese Weise strukturierten Daten werden an diverse Drittsysteme weitergeben (z.B. Warenwirtschaft) oder lösen weitere Aktionen aus (z.B. Reklamationswesen). Anlieferungen sind zeitlich nicht immer gleichverteilt, sodass es öfter zu einem Aufstauen der zu bearbeitenden Fälle kommt. Dieser Rückstau löst sich über die Zeit wieder auf – sei es durch entsprechende Überstunden oder Tage mit einer geringeren Anzahl an neuen Fällen.

Im gleichen Unternehmen langen täglich über die entsprechende Rubrik der Webseite im Durchschnitt 3 Bewerbungen ein. Diese bestehen in der Regel aus einem kurzen Anschreiben und einem Lebenslauf – beide im pdf-Format. Diese Dokumente werden von einem Recruiter gesichtet und offenen Stellen bzw. Fachabteilungen zugeordnet.

Bei der schnellen Zuordnung der Personen zu möglichen Stellen im Unternehmen wird auf bestimmte Schlüsselwörter geachtet wie diverse Tätigkeiten, Technologien bzw. Zertifizierungen oder andere Befähigungsnachweise.

 

 

3. Das AI Pattern – Intelligente Dokumentenverarbeitung

Beispielsweise wollen wir hier das AI Pattern „Intelligente Dokumentenverarbeitung“ im Kontext der oben kurz umrissenen Prozesse betrachten.

Name: Intelligente Dokumentenverarbeitung (Intelligent Document Processing)

Kontext: Dokumente enthalten beliebige Informationen in unstrukturierter Form. Um diese automatisiert weiter verarbeiten zu können, benötigen IT-Systeme Informationen jedoch als Daten, welche einer vordefinierten Struktur folgen. Durch Intelligente Dokumentenverarbeitung können bestimmte Informationen (Entitäten) selbst aus heterogenen Dokumenten automatisch extrahiert und strukturiert werden.

Technologien:

  • Optische Zeichenerkennung (OCR)
  • Entitätenextraktion (Named Entity Recognition)
  • Text-Klassifizierung

Einsatzmuster:

  • Information muss von einem Blatt Papier in ein Softwaresystem abgetippt werden
  • Informationen werden aus einem digitalen Dokument (E-Mail, pdf, etc…) gesucht und via Kopieren und Einfügen in ein anderes Softwaresystem übertragen
  • Strukturierte Daten werden aus Fließtext abgeleitet

 

3.1. Sub-Pattern – Dokumenten-Klassifizierung

Name: Dokumenten-Klassifizierung

Kontext: Prozesse werden durch Dokumente unterschiedlichen Typs (diverse Vertragstypen, Rechnungen, Belege, technische Dokumentationen, etc.) begleitet. Oft ist dieser Typ allerdings weder anhand von Dateiformaten noch Namen ersichtlich. Durch Klassifizierung kann der Typ eines Dokuments rein anhand seines Inhalts festgestellt bzw. verifiziert werden.

Einsatzmuster:

  • Zum schnelleren Zugriff auf bestimmte Informationen muss der Typ eines Dokuments ersichtlich sein
  • Zur Vollständigkeitsprüfung entlang eines Prozesses muss das Vorhandensein bestimmter Dokumententypen bestätigt werden
  • Der Typ eines Dokuments muss bekannt sein um daraus die weiteren Verarbeitungsschritte ableiten oder konkretisieren zu können

 

3.2. Sub-Pattern – Text-Klassifizierung

Name: Text-Klassifizierung

Kontext: Einzelne Textfragmente sind oft Klassen zuordenbar. Diese Klassen können von gleichen behandelten Themen (z.B. Nachrichtenartikel) oder gar Synonymen bis hin zu Fachspezifika (z.B. Zuordnung von Buchungstexten zu Kontenklassen) reichen.

Einsatzmuster:

  • Textpassagen oder -blöcke müssen einem Thema zugeordnet werden
  • Freitextformulierungen werden harmonisiert, indem sie in vordefinierte Katalogeinträge umgeschlüsselt werden

 

3.3. Sub-Pattern – Entitätenextraktion

Name: Entitätenextraktion (Named Entity Extraction)

Kontext: Die Bedeutung von Texten konzentriert sich oft in wenigen Worten, während die restlichen etwa als Füllwörter ohne signifikante Aussagekraft rein für den besseren Textfluss sorgen. Um Texte maschinell verarbeiten zu können gilt es, Datenpunkte aus Freitext zu extrahieren. Diese können Personen, Unternehmensnamen, Orts- oder Zeitangaben, etc. sein.

Einsatzmuster:

  • Textpassagen oder Dokumente werden auf ein einheitliches Tabellenformat reduziert
  • Vordefinierte Datenpunkte werden aus Freitext extrahiert

 

4. Anwendungsfall

Entsprechend unseres Ansatzes prüfen wir die Relevanz des vorgestellten AI Patterns für unsere verschiedenen Unternehmensbereiche.

 

 

4.1. Unternehmensbereich – Logistik

In der Logistik entstehen wie oben beschrieben manuelle Aufwände an mehreren Stellen. Wir stellen grundsätzlich einen Modalitätsbruch im Prozess fest. Wir beginnen mit dem gedruckten Lieferschein, welcher noch abgestempelt wird, bevor durch den Scan der Wechsel in die digitale Weiterverarbeitung passiert.

Als erstes Potential für einen Effizienzgewinn können wir festhalten, dass Lieferscheine nicht separat, sondern in bestimmten Intervallen im Stapel gescannt werden. Das spätere Trennen der einzelnen Dokumente in separate Dateien kann die KI übernehmen. Lösbar ist dies unter anderem durch das Pattern der Dokumenten-Klassifizierung, indem man jede Seite als Dokument betrachtet und klassifiziert, ob es sich um die „Start-Seite“ eines Dokuments oder eine Folgeseite handelt.

Eine nachgelagerte Dokumentenklassifizierung kann sicherstellen, dass es sich tatsächlich durchwegs um Lieferscheine handelt und andere Dokumente automatisch aussortieren und zur manuellen Weiterbearbeitung vorlegen.

Weiter geht es mit der Zuordnung einer Lieferung zu einer Bestellung. Hier kommt das Pattern der Entitätenextraktion ins Spiel. Nach einer OCR werden relevante Entitäten wie Lieferant, Bestell-/Auftragsnummer bzw. Lieferpositionen extrahiert. Dies erlaubt in Regelfällen die vollautomatische Zuordnung zu Bestellungen und in einfachen Fällen auch die Prüfung auf Mengen bzw. allgemeine Vollständigkeit.

Die Extraktion der Entitäten ermöglicht auch weitere kleinere Verbesserungen der automatisierten Dokumentenverarbeitung. Einfache Beispiele sind hier die konsistente Benennung der Dateien nach Bestellnummer und Dokumententyp oder die Übergabe von Metadaten an Drittsysteme.

Wir vermerken die identifizierten Einsatzmöglichkeiten und untersuchen den nächsten Unternehmensbereich.

 

4.2. Unternehmensbereich – Personal

Im Personalwesen haben wir nicht mit Lieferscheinen sondern Bewerbungsunterlagen als grundlegende Dokumente zu tun.

Zur Unterstützung aller weiteren Arbeiten kann auch hier eine vorgelagerte Dokumenten-Klassifizierung Dateien nach Anschreiben, Lebensläufen, Zeugnissen, etc. sortieren und konsistent benennen bzw. ein entsprechendes Tool an geeigneter Stelle hinterlegen.

Die Zuordnung zu Fachabteilungen, bei laufend wiederkehrenden Ausschreibungen auch offenen Stellen, kann ähnlich dazu mit einer Text-Klassifizierung automatisiert werden. Ebenso kann auf das Vorhandensein bestimmter Informationen wie Ausbildung, benötigte Zertifizierungen, vorhandene Berufserfahrung geprüft werden.

 

5. Evaluierung

Beim Verfolgen des AI-Patterns-Ansatzes bewerten wir nun jeden Use Case bzw. jedes KI-Einsatzpotential für sich. In Folge werden wir nun aber zur plakativeren Darstellung die beiden oben beschriebenen Umfelder gegenüberstellen.

Zuerst bewerten wir das Automatisierungspotential durch einen Use Case. Im Falle der Logistik gehen wir wie beschrieben von 1.000 Fällen pro Werktag aus. Für jede Minute, welche es gelingt, den Prozess für eine einzelne Anlieferung effizienter zu machen, skaliert dies auf ca. 250.000 Minuten bzw. über 500 Personentage pro Jahr. Das ist eine enorme Arbeitsleistung – und bedeutet, dass diese Zeit zur Verfügung steht um sich intensiver um Sonderfälle wie Reklamationen annehmen zu können.

Im Falle der Bewerbungen überschlagen wir den Effizienzgewinn nach gleichem Schema und kommen auf 750 Minuten bzw. 12,5 Stunden pro Jahr.

Als einen Aspekt der Risiko- und Aufwandsabschätzung für die Umsetzung der beiden Use Cases in einer Softwarelösung sehen wir uns die Datengrundlage an, auf welcher wir Machine-Learning-Verfahren aufsetzen können. Im Logistikbereich gehen wir von einer viertel Million Dokumente pro Jahr aus, für welche aus der Bestandsoftware die historischen extrahierten und relevanten Daten exportierbar sind. Es entfällt somit ein aufwändiges manuelles annotieren möglicher Trainingsdaten.

Dem steht eine limitierte Anzahl an Zulieferern, wiederkehrende gelieferte Produkte, etc. gegenüber. Wir sprechen hier von einer überschaubaren Menge an Freiheitsgraden und somit in Summe moderater Komplexität bzw. Risiko.

Anders verhält es sich bei der Anwendung im Personalwesen. Die Anzahl der Fälle ist deutlich geringer, was bedeutet, um die gleiche Anzahl an Dokumenten zu sammeln bedarf es eines Vielfachen der Zeit. Dazu kommt, dass jede Bewerberin bzw. jeder Bewerber ein Individuum ist, somit auch jeder Lebenslauf anders gestaltet ist, mit unterschiedlichem Aufbau, Detailgrad, Art der Formulierung und Wahl der Begriffe, etc. Es gibt somit deutlich mehr Freiheitsgrade und eine entsprechend höhere Komplexität was eine softwaregestützte Automatisierung der Arbeitsabläufe betrifft.

Neben diesen beiden Aspekten – des Nutzens und der Datengrundlage als ein Aspekt des Entwicklungsaufwands und -risikos – gilt es noch eine Reihe weiterer Bewertungsfaktoren mit zu berücksichtigen. Wesentliche Einflussfaktoren können hier verfügbare Open-Source-Komponenten, Modelle oder Daten sein, aber auch Aspekte wie die Akzeptanz von KI-Lösungen und die Bereitschaft der betroffenen Personen auch ihre Arbeitsabläufe umzustellen.

 

 

6. Praxisbeispiele

Eine erfolgreiche Umsetzung und Produktivsetzung des AI Patterns „Intelligente Dokumentenverarbeitung“ haben wir etwa für die österreichischen Solzialversicherungsträger im Auftrag der zentralen IT-Services der Sozialversicherung GmbH durchgeführt (Siehe auch: https://www.cloudflight.io/de/project/automatisierte-rueckerstattung/).

Das Einsatzgebiet dort ist die Abwicklung der Kostenrückerstattungen für Wahlarztbesuche, welche Patienten vorab selbst bezahlen. Analog zum oben beschriebenen Umfeld der Logistik werden auch hier Dokumente nach Typen unterschieden, die relevanten Informationen (Entitäten) extrahiert, abgerechnete Leistungen anhand der Leistungskataloge der einzelnen Versicherungsträger klassifiziert, etc.

Dieses System verarbeitet aktuell täglich ca. 4.000 Dokumente und wird noch auf weitere Einheiten ausgerollt. Selbst bei relativ geringer Arbeitserleichterung pro Fall rentiert sich diese Anwendung somit über die Skalierung. Tatsächlich ist es den Versicherungsträgern gelungen mit dieser Technologieunterstützung den gebildeten Bearbeitungsrückstau aufzulösen und den Versicherten einen besseren, weil wesentlich schnelleren, Service zu bieten.

Das Pattern Intelligente Dokumentenverarbeitung bietet derart große Potentiale, dass wir eine wiederverwendbare Lösung „Picklist“ (Siehe auch: https://www.cloudflight.io/de/picklist/) konzipiert und entwickelt haben, auf welcher wir individuelle Lösungen effizient aufsetzen können.

 

7. Zusammenfassung

In unserem letzten Artikel haben wir die Cloudflight AI Patterns als strukturierten Beratungsansatz rund um die Einführung bzw. den Ausbau von KI in Unternehmen vorgestellt. Darauf aufbauend haben wir nun zur besseren Veranschaulichung ein konkretes Pattern anhand zweier möglicher Einsatzszenarien betrachtet. Dabei ist der natürliche erste Schritt die unvoreingenommene Identifizierung aller möglicher Use Cases. Erst in einem nächsten Schritt werden die Potentiale anhand unterschiedlicher Aspekte erhoben. Grund für diese Reihenfolge ist, nicht Themen frühzeitig aufgrund ihres ungünstigen Kosten-/Nutzen-Verhältnisses zu verwerfen. Im Gesamtbild können sie dennoch aufgrund von Synergieeffekten zwischen ähnlich gelagerten Anwendungen wieder gewinnbringend werden.

Gerne begleiten und unterstützen wir Sie entlang dieses Wegs mit unserer Erfahrung aus zahlreichen KI-Einführungs- bzw. Umsetzungsprojekten.