Die sinnvolle Bildung von Clustern anhand von Jobvakanzen, in denen Stellenbeschrieb, Fähigkeiten und Kompetenzen zusammengefasst und ausgewertet werden.
Machine Learning, Natural Language Processing, Python, Clustering
Das Ziel dieser Arbeit ist eine hierarchische Gruppierung von diesen Vakanzen in Cluster. In diesen Clustern sollen Jobs mit den gleichen oder ähnlichen Anforderungen enthalten sein. Ohne eine Gruppierung ist es nahezu unmöglich, Aussagen über die Gemeinsamkeiten der Anforderungen in den Jobvakanzen zu treffen. Mit Hilfe von Clustern können Ähnlichkeiten festgestellt werden und somit auch ähnliche Vakanzen gruppiert werden.
Die Ausgangslage ist eine Sammlung von Jobvakanzen verschiedener Jobplattformen aus den deutschsprachigen Teilen der Schweiz. Diese werden über einen Web Crawler zusammengetragen. Bei den Vakanzen handelt es sich jeweils um den Titel der Stelle und dem Stellenbeschrieb.
Die Applikation, die aus diesem Projekt resultiert, gruppiert Jobvakanzen mit dem Hierarchical Agglomerative Clustering Algorithmus. Die Gruppierung wird anhand der Stellenbeschriebe und den darin enthaltenen, gewichteten Skills vorgenommen. Die Vakanzen werden als Text in die Applikation gelesen. Diese Texte werden aufbereitet, so dass mit Hilfe des Algorithmus automatisch ein Clustering durchgeführt werden kann. Als Resultat wird eine JSON-Datei mit den entstandenen Clustern und den dazugehörenden Informationen ausgegeben.
Projektdauer: September 2018 - März 2019
Aufwand in Personenstunden: 400h (200h pro Person)
Teamgrösse: 2 Personen
Manfred Vogel, manfred.vogel@fhnw.ch
Dominik Frefel, dominik.frefel@fhnw.ch
Samantha Howlett
Kevin Schäfer
Manfred Vogel, manfred.vogel@fhnw.ch
Dominik Frefel, dominik.frefel@fhnw.ch