2017-07-17 99 views
1

我目前正在開發一個軟件,可以根據用戶配置文件將用戶連接到作業。我在作業描述上運行了文本分析,並從中導出了重要的關鍵字。我還從他們的個人資料中收集了用戶信息。將作業匹配到用戶配置文件似乎是一項具有挑戰性的任務。是否有任何基於機器學習的算法可用於比賽制作?將用戶配置文件與就業機會相匹配

回答

1

OK,所以基本上,你必須爲每個職位描述關鍵字,然後你有某種形式的文本數據來嘗試匹配的關鍵字,(用戶配置文件)的。

由於您的訓練數據(用戶配置文件)未標記,因此supervised learning不會幫助您。 Unsupervised learning(集羣)也許可以幫助你從負載的用戶配置文件找到某些模式(關鍵字),但你肯定會需要嘗試不同種類的技術(如gaussian mixture models等),並觀察可能的模式。

你可能做的更簡單的事情是爲每個用戶配置文件派生/查找關鍵字(換句話說,以確定用戶配置文件中還存在多少個工作關鍵字),然後使用cosine similarity比較它們之間的距離。那麼您只需要確定最小角度閾值。這將是一個參數。當然,你需要使用bigrams或類似的矢量化你的文本數據;如果你使用Python,scikit已經有feature extraction)。你可能也使用tf-idf矢量化兩個,工作內容和用戶配置文件,但有一些沉重,以及決心的話停止列表。

相關問題