nw  

Job Clustering

Clustering Placeholder
Zusammenfassung

Die sinnvolle Bildung von Clustern anhand von Jobvakanzen, in denen Stellenbeschrieb, Fähigkeiten und Kompetenzen zusammengefasst und ausgewertet werden.

Schlüsselbegriffe

Machine Learning, Natural Language Processing, Python, Clustering

Zielsetzung

Das Ziel dieser Arbeit ist eine hierarchische Gruppierung von diesen Vakanzen in Cluster. In diesen Clustern sollen Jobs mit den gleichen oder ähnlichen Anforderungen enthalten sein. Ohne eine Gruppierung ist es nahezu unmöglich, Aussagen über die Gemeinsamkeiten der Anforderungen in den Jobvakanzen zu treffen. Mit Hilfe von Clustern können Ähnlichkeiten festgestellt werden und somit auch ähnliche Vakanzen gruppiert werden.

Ausgangslage

Die Ausgangslage ist eine Sammlung von Jobvakanzen verschiedener Jobplattformen aus den deutschsprachigen Teilen der Schweiz. Diese werden über einen Web Crawler zusammengetragen. Bei den Vakanzen handelt es sich jeweils um den Titel der Stelle und dem Stellenbeschrieb.

Ergebnisse

Die Applikation, die aus diesem Projekt resultiert, gruppiert Jobvakanzen mit dem Hierarchical Agglomerative Clustering Algorithmus. Die Gruppierung wird anhand der Stellenbeschriebe und den darin enthaltenen, gewichteten Skills vorgenommen. Die Vakanzen werden als Text in die Applikation gelesen. Diese Texte werden aufbereitet, so dass mit Hilfe des Algorithmus automatisch ein Clustering durchgeführt werden kann. Als Resultat wird eine JSON-Datei mit den entstandenen Clustern und den dazugehörenden Informationen ausgegeben.

Projektdaten

Projektdauer: September 2018 - März 2019
Aufwand in Personenstunden: 400h (200h pro Person)
Teamgrösse: 2 Personen

Auftraggeber

Manfred Vogel, manfred.vogel@fhnw.ch
Dominik Frefel, dominik.frefel@fhnw.ch

Projektteam

Samantha Howlett
Kevin Schäfer

Kontakt

Manfred Vogel, manfred.vogel@fhnw.ch
Dominik Frefel, dominik.frefel@fhnw.ch

<< zurück