2010-07-31 44 views
1

我有文章列表: 標題,副標題和正文。如何按上下文分組文章? - 自然語言

現在我需要解析所有這些文章和組起來下根據他們可能關鍵字不同語境種類或子類別。

例如,如果文章很可能會涉及到跑車則文章將與汽車或/和車輛情境相關


現在我明白了,這是一片汪洋大海,而這也是爲什麼我已經提出這個問題。因爲解決方案的海洋對我來說可能太大了,我很可能會迷失方向並採取一些糟糕的思想解決方案。

可能有一些流行的和標準化的方法來做到這一點,我不知道,如果有人指出我正確的方向,這將是非常有用的。

幫助會很好。 =)

+0

http://en.wikipedia.org/wiki/Category:Library_of_Congress_Classification – Joni 2010-07-31 16:32:49

回答

1

Natural Lanugage Toolkit但是不要指望在那裏有一個神奇的子彈,這將使你不得不學習一些關於語言學的知識,因爲你所描述的問題不能完全機械地解決。