Machbarkeitsstudie und Prototyp zur Teilautomatisierten Verarbeitung von Materialzeugnissen für die Fehlerreduktion beim Wareneingang.
PDF, MinHashing, Locality Sensitiv Hashing, Python
Ziel der Arbeit ist ein lauffühiger Prototyp für einen selbstlernenden Algorithmus, welcher basierend auf Informationsvorgaben Materialzeugnisse klassifiziert, die gesuchten Informationen extrahiert und einer definierten Schnittstelle übergibt. Dabei müssen allenfalls fehlende oder unsichere Informationen für eine manuelle Nachbearbeitung markiert werden.
Die Endress+Hauser Flowtec AG verarbeitet wöchentlich ca. 100 Materialzeugnisse von Lieferanten. Diese Materialzeugnisse müssen durch einen Mitarbeiter auf die geforderten Normen überprüft und anschliessend in eine Datenbank eingelesen werden. Dieser manuelle Prozess ist aufwändig und vor allem fehleranfällig. Jeder Fehler bei der Eingabe der Daten kann zu einer Kundenreklamation führen, was aufwändiges Nachbessern zur Folge hat.
Wir konnten mehrere, ähnliche, gelabelte Dokumente auf ein Layout reduzieren und die erlernten Feature-Positionen für neue Dokumente wiederverwenden. Wir zeigen, dass mit einer genug grossen Trainings-Menge, die gewünschten Werte zu über 57% automatisch ausgelesen werden können. Wir haben bewiesen, dass die Werte aus trainierten Dokumenten wieder korrekt ausgelesen werden können, obwohl die Anzahl Layout-Definitionen kleiner ist als die Anzahl Dokumente.
Die Umsetzbarkeit, im Rahmen der Akzeptanz des Kunden, wurde durch die Entwicklung eines ersten Protopyen bewiesen. Kunde hat klare besträbungen das Produkt in Zukunft in den Prozess der Flotec einzugliedern.
Projekttyp | Projektarbeit des 5. Semesters, Ip5 |
---|---|
Projektdauer | 01.03.2017 - 20.07.2018 |
Personenstunden | Zusammen 360 |
Teamgrösse | 2 |
Endress+Hauser Flowtec AG, Kägenstrasse 7, 4153 Reinach, flowtec.endress.com
Ansprechsperson: Stefan Oswald
Patrick Burkhalter, Hasan Kara