nw  

CV Extraktion ETL

Zusammenfassung

Digitalisierung der Mitarbeiter CVs in einer Ontologie.

Schlüsselbegriffe

Curriculum Vitae, Datenextraktion, Ontologie, Semantic Web, Description Logic, RDF, Protégé, GraphDB, Triple Store, C#, .NET Core, ASP.NET Core, dotNetRDF.

Ausgangslage

Die Mitarbeiter der ti&m AG pflegen die eigenen CVs als Word, PowerPoint und PDF Dateien in jeweils zwei Sprachen.
Alle CV sind auf der ti&m internen Collab-Plattform abgelegt.
Für die Ausarbeit einer Offerte müssen die Offerten-Mitarbeiter passende CVs suchen bzw. finden.
Dieser Prozess ist geprägt von manueller Arbeit, da es keine Suchfunktion oder Indexierung der CV Dokumente gibt.

Zielsetzung

Im Rahmen eins Proof-of-Concepts soll ein Ontologie-basierter Ansatz verfolgt und geprüft werden.
Die CV Informationen sollen in einer Ontologie digitalisiert werden.
Durch die Ontologie soll ein Mehrwert aus den Daten generiert werden, welcher die Offerten-Mitarbeiter bei der CV Suche unterstützt.
Durch die Digitalisierung soll die CV pflege für die Mitarbeiter der ti&m AG vereinfacht werden.

Ergebnisse

Es wurde eine minimale Ontologie erstellt welche die Mitarbeiter und deren Know-How aufnimmt.
In Protégé wurden Äquivalenzklassen definiert, um die Mitarbeiter anhand Ihres Know-Hows durch klassifizieren zu können.
In der Web Anwendung erfassen die Mitarbeiter das eigene Know-How über ein einfaches Formular.
Der GraphDB Triple Store verwendet die definierten Äquivalenzklassen um die Mitarbeiter automatisch zu klassifizieren.
Für die Offerten-Mitarbeiter steht eine Suche zur Verfügung mit welcher nach Know-How, aber auch nach Klassifizierung suchen zu können.
Der Ontologie-basierte Lösungsweg ist ein vielversprechender Ansatz, um das CV Problem der ti&m AG zu lösen.
Die ti&m AG plant den Ontologie-basierte Ansatz weiter zu verfolgen.

Basis Ontologie nach der Datenextraktion.
Static und Inferred Class Hierachy (Protégé).
Architektur Proof-of-Concept.
Projektdaten

Projektdauer 1 Semester
Aufwand 180 Stunden
Teamgrösse 1 Person

Auftraggeber
ti&m AG
Buckhauserstrasse 24
8048 Zürich
www.ti8m.ch
Projektteam
Pascal Peter Studienrichtung Informatik (berufsbegleitend)
7. Semester.
pascal.peter@students.fhnw.ch
Kontakt
Prof. Bernhard C. Wyss Fachhochschule Nordwestschweiz
Hochschule für Technik
Institut für Mobile und Verteilte Systeme
Leiter MAS IT
bernhard.wyss@fhnw.ch
<< zurück