Automatisierte Verarbeitung komplexer Bestelldokumente

Ein Unternehmen mit hohem Bestellaufkommen stand vor der Herausforderung, täglich große Mengen an PDF-Dokumenten zu verarbeiten. Obwohl die Inhalte größtenteils ähnlich waren, erschwerten die deutlichen Unterschiede in Struktur und Layout eine konsistente Verarbeitung.

Die manuelle Bearbeitung war sehr aufwändig, erhöhte das Fehlerrisiko und sorgte für wenig Transparenz. Mit steigenden Bestellvolumen wurde schnell klar, dass dieser Ansatz nicht skalierbar ist.

Ziel des Projekts war es, den manuellen Prozess zu automatisieren, ohne Qualität, Nachvollziehbarkeit oder Kontrolle zu verlieren. Durch die Kombination aus intelligenter Automatisierung und integrierter Validierung wurde der Workflow schneller, zuverlässiger und für Mitarbeitende deutlich einfacher zu steuern.

Wie ein manueller Prozess mit uneinheitlichen PDF-Dokumenten in eine skalierbare Lösung überführt wurde

Ausgangslage

Hoher manueller Aufwand bei variierenden Formaten

Lösung

Mehrstufige KI gestützte Datenerfassung mit Validierung

Ergebnis

Weniger manuelle Arbeit, höhere Qualität, bessere Übersicht

Zu viele Formate, hoher manueller Aufwand

Ausgangssituation

Die eingehenden Bestellungen stammten aus unterschiedlichen Quellen und folgten keinem einheitlichen Layout. Trotz ähnlicher Inhalte waren die Dokumente strukturell so unterschiedlich, dass regelbasierte Datenerfassung an ihre Grenzen stießen. Relevante Daten mussten daher manuell in ein Zielsystem übertragen werden.

Bestelldokumente und Abstimmungen wurden überwiegend per E-Mail abgewickelt, was zu geringer Transparenz und hohem Koordinationsaufwand führte. Mit steigenden Volumina wurde deutlich, dass dieser Ansatz langfristig nicht tragfähig ist.

Herausforderungen auf einen Blick

Unterschiedliche Dokumentlayouts
Manuelle Übertragung ins Zielsystem
Hohe Fehleranfälligkeit
Abstimmung und Nachfragen per E-Mail
Begrenzte Skalierbarkeit bei steigendem Volumen

Automatisierung ohne Kontrollverlust

Zielsetzung

Ziel des Projekts war es, einen automatisierten Prozess zu schaffen, der relevante Informationen aus unterschiedlich strukturierten Bestelldokumenten zuverlässig erkennt und in bestehende Zielsysteme überführt. Der manuelle Aufwand sollte deutlich reduziert werden, ohne die fachliche Kontrolle zu verlieren.

Zentrale Anforderungen waren eine hohe Erkennungsqualität, der sichere Umgang mit variierenden Formaten sowie eine Architektur, die zukünftige Anpassungen ermöglicht. Zudem sollte der Prozess transparenter werden und die Zusammenarbeit verbessern.

Ziele des Projekts

Automatisierte Erkennung relevanter Bestelldaten

Umgang mit variierenden Dokumentstrukturen

Deutliche Reduktion manueller Arbeit

Hohe Datenqualität und Nachvollziehbarkeit

Zukunftsfähige und erweiterbare Architektur

Flexible Interpretation statt fester Regeln

Lösungsansatz

Eine Analyse der bestehenden Prozesse zeigte, dass eine feste, regelbasierte Extraktion nicht ausreichte. Stattdessen wurde ein Ansatz gewählt, der den Dokumentinhalt interpretiert und sich flexibel an unterschiedliche Layouts anpasst.

Im ersten Schritt werden PDF-Dateien in Bilder umgewandelt, damit visuelle Strukturen (Tabellen, Stempel, handschriftliche Notizen, ungewöhnliche Layouts) für die nachgelagerte Verarbeitung zuverlässig zugänglich sind. Anschließend wird der Inhalt mit Large Language Models (LLMs) analysiert, um Text und Kontext über einfache Mustererkennung hinaus zu verstehen.

Danach werden Dokumenttyp und relevante Metadaten identifiziert und bewertet, um zu entscheiden, ob eine weitere Verarbeitung erforderlich ist (z. B. Weiterleitung an das passende Extraktions-Template, Anwendung dokumentspezifischer Prüfungen oder Überspringen nicht unterstützter Inputs).

Auf Basis dieser Klassifizierung werden relevante Daten in mehreren Stufen extrahiert: eine erste Erfassung potenzieller Felder, eine Verfeinerung mit Kontext über mehrere Seiten hinweg sowie die Normalisierung in die Zielstruktur.

Zur Qualitätssicherung werden die extrahierten Ergebnisse logisch validiert (Vollständigkeitsprüfungen, Konsistenz zwischen Feldern, plausible Wertebereiche) und zusätzlich von einem zweiten Modell überprüft. Das reduziert Fehlinterpretationen deutlich.

In unklaren Fällen oder bei geringer Confidence greift der Prozess schließlich auf gezielte menschliche Unterstützung zurück. Der Review-Aufwand konzentriert sich dabei nur auf die Stellen, an denen automatische Validierung und Modell-Übereinstimmung nicht ausreichen.

Automatisierter Workflow

Iterativ, Asynchron, Effizient

Umsetzung

Zu Beginn wurde ein Proof of Concept umgesetzt, um den Ansatz mit realen Dokumenten zu validieren. Bereits früh zeigte sich, dass ein Großteil der Dokumente zuverlässig erkannt und verarbeitet werden kann.

Die Umsetzung erfolgte iterativ in kurzen Zyklen mit enger Abstimmung. Anpassungen konnten so frühzeitig vorgenommen werden.

Rechenintensive Verarbeitungsschritte wurden ausgelagert und asynchron umgesetzt. Modellwechsel und Erweiterungen ließen sich ohne größere Umbauten realisieren.

Parallel wurde auch der Arbeitsprozess optimiert. Bestellungen werden automatisch zugeordnet, zentral verwaltet und direkt im System abgestimmt.

Mehr Effizienz, bessere Übersicht, höhere Qualität

Ergebnis

Durch die Einführung des automatisierten Prozesses wurde der manuelle Aufwand deutlich reduziert. Mitarbeitende müssen Bestellungen nicht mehr vollständig erfassen, sondern prüfen die automatisch extrahierten Ergebnisse.

Die Fehlerquote sank spürbar, während gleichzeitig mehr Bestellungen fristgerecht verarbeitet werden konnten. Der Prozess wurde insgesamt transparenter, da Dokumente, Daten und Kommunikation zentral verfügbar sind.

Zusätzlich verbesserte sich die Arbeitszufriedenheit, da repetitive Tätigkeiten reduziert wurden und der Fokus stärker auf fachliche Prüfung und Steuerung liegt.