PowerTower
Automatisierte Bausteinerkennung für nachhaltige Energieplanung.
Ausgangslage
Das Power Tower Spiel, entwickelt vom WWF Schweiz, dient als exploratives Lernspiel, das verschiedene Szenarien zur CO2-neutralen Stromversorgung bis 2035 simuliert. Aktuell erfordert das Spiel einen menschlichen Coach, der die Spielmechanik erklärt und die Auswirkungen der gewählten Bausteine berechnet. Dieser manuelle Prozess ist zeitaufwendig und fehleranfällig. Eine automatisierte Lösung wird benötigt, um das Spiel effizienter und unabhängiger zu gestalten.
Zielsetzung
Ziel des Projekts ist die Entwicklung einer automatisierten Bildverarbeitungspipeline, die die Position und Beschriftung der Bausteine des Power Tower Spiels anhand von Bildaufnahmen erkennt. Durch den Einsatz von OCR-Technologien und Bildverarbeitungsverfahren soll eine robuste und skalierbare Lösung entstehen, die den menschlichen Coach ersetzt und die Spielergebnisse in einer Webanwendung präsentiert.
Optimales Bild
Für eine optimale Erfassung der Bausteine ist eine gute Beleuchtung essenziell, um Texte und Konturen klar darzustellen. Zudem sollte der Turm zentriert aufgenommen werden, damit alle Bausteine vollständig sichtbar sind. Es ist wichtig, visuelle Störungen wie Reflexionen und Schatten so weit wie möglich zu minimieren, um eine präzise Erkennung zu gewährleisten. Darüber hinaus spielt eine hohe Bildauflösung eine entscheidende Rolle, da sie sicherstellt, dass auch kleinste Texte auf den Bausteinen deutlich lesbar sind.
Bildmanipulation
Es wird ein Graustufen Bild erzeugt auf dem verschiedene Bildmanipulationen durchgeführt werden, um eine optimale erkennung zu gewährleisten mit unterschiedlichen Bedingungen. Damit erreicht man eine optimale Texterkennung
Resultat
Die generierten Bilder werden nacheinander an Tesseract übergeben, das die Beschriftungen der Bausteine extrahiert. Diese vielseitige Vorbereitung der Bilder stellt sicher, dass Tesseract unter verschiedenen Bedingungen optimale Ergebnisse liefert. Der Output von Tesseract wird anschliessend in der Pipeline weiterverarbeitet, um die Bausteine zuverlässig zu erkennen und zu klassifizieren.
Ergebnisse
Die entwickelte Pipeline erreichte eine Erkennungsrate von 97,98 % unter idealen Bedingungen und 88 % unter herausfordernden Bedingungen. Mithilfe von OCR-Technologien wie Tesseract und fortschrittlichen Bildverarbeitungsmethoden konnte eine hohe Präzision erzielt werden.
- Automatische Texterkennung und Validierung.
- Robuste Bildverarbeitung unter verschiedenen Lichtverhältnissen.
- Optimierungspotenzial durch weitere Trainingsdatensätze.
Die Tests haben gezeigt, dass die Pipeline in der Lage ist, die Bausteine zuverlässig zu erkennen und deren Position und Beschriftung präzise zu analysieren. Weitere Optimierungen könnten die Erkennungsrate weiter verbessern, insbesondere in schwierigen Lichtverhältnissen oder komplexen Hintergründen.
Technische Schlüsselbegriffe
- OCR (Optical Character Recognition) Technologie zur automatisierten Texterkennung.
- Bildverarbeitung Manipulation von Bilddaten
- Bilderkennung Automatisches Auswertung von Bilddaten
Kund:in

WWF Schweiz
Nicolas Busch & Leandro De Angelis
Hohlstrasse 11, Postfach
8010 Zürich
WWF Webseite
Team
Jasjot Singh
Luc Hartmann
Betreuerin
Hilko Cords