PowerTower

Automatisierte Bausteinerkennung für nachhaltige Energieplanung.

Text

Ausgangslage

Das Power Tower Spiel, entwickelt vom WWF Schweiz, dient als exploratives Lernspiel, das verschiedene Szenarien zur CO2-neutralen Stromversorgung bis 2035 simuliert. Aktuell erfordert das Spiel einen menschlichen Coach, der die Spielmechanik erklärt und die Auswirkungen der gewählten Bausteine berechnet. Dieser manuelle Prozess ist zeitaufwendig und fehleranfällig. Eine automatisierte Lösung wird benötigt, um das Spiel effizienter und unabhängiger zu gestalten.

Zielsetzung

Ziel des Projekts ist die Entwicklung einer automatisierten Bildverarbeitungspipeline, die die Position und Beschriftung der Bausteine des Power Tower Spiels anhand von Bildaufnahmen erkennt. Durch den Einsatz von OCR-Technologien und Bildverarbeitungsverfahren soll eine robuste und skalierbare Lösung entstehen, die den menschlichen Coach ersetzt und die Spielergebnisse in einer Webanwendung präsentiert.

Optimales Bild

FHNW

Für eine optimale Erfassung der Bausteine ist eine gute Beleuchtung essenziell, um Texte und Konturen klar darzustellen. Zudem sollte der Turm zentriert aufgenommen werden, damit alle Bausteine vollständig sichtbar sind. Es ist wichtig, visuelle Störungen wie Reflexionen und Schatten so weit wie möglich zu minimieren, um eine präzise Erkennung zu gewährleisten. Darüber hinaus spielt eine hohe Bildauflösung eine entscheidende Rolle, da sie sicherstellt, dass auch kleinste Texte auf den Bausteinen deutlich lesbar sind.

Bildmanipulation

FHNW

Es wird ein Graustufen Bild erzeugt auf dem verschiedene Bildmanipulationen durchgeführt werden, um eine optimale erkennung zu gewährleisten mit unterschiedlichen Bedingungen. Damit erreicht man eine optimale Texterkennung

Resultat

FHNW

Die generierten Bilder werden nacheinander an Tesseract übergeben, das die Beschriftungen der Bausteine extrahiert. Diese vielseitige Vorbereitung der Bilder stellt sicher, dass Tesseract unter verschiedenen Bedingungen optimale Ergebnisse liefert. Der Output von Tesseract wird anschliessend in der Pipeline weiterverarbeitet, um die Bausteine zuverlässig zu erkennen und zu klassifizieren.

Ergebnisse

Die entwickelte Pipeline erreichte eine Erkennungsrate von 97,98 % unter idealen Bedingungen und 88 % unter herausfordernden Bedingungen. Mithilfe von OCR-Technologien wie Tesseract und fortschrittlichen Bildverarbeitungsmethoden konnte eine hohe Präzision erzielt werden.

  • Automatische Texterkennung und Validierung.
  • Robuste Bildverarbeitung unter verschiedenen Lichtverhältnissen.
  • Optimierungspotenzial durch weitere Trainingsdatensätze.

Die Tests haben gezeigt, dass die Pipeline in der Lage ist, die Bausteine zuverlässig zu erkennen und deren Position und Beschriftung präzise zu analysieren. Weitere Optimierungen könnten die Erkennungsrate weiter verbessern, insbesondere in schwierigen Lichtverhältnissen oder komplexen Hintergründen.

Technische Schlüsselbegriffe

  • OCR (Optical Character Recognition) Technologie zur automatisierten Texterkennung.
  • Bildverarbeitung Manipulation von Bilddaten
  • Bilderkennung Automatisches Auswertung von Bilddaten

Kund:in

Logos

WWF Schweiz
Nicolas Busch & Leandro De Angelis
Hohlstrasse 11, Postfach
8010 Zürich
WWF Webseite

Team

Jasjot Singh
Luc Hartmann

Betreuerin
Hilko Cords