2012-03-30 54 views
4

我正在構建一個執行句子檢查的應用程序。你知道有哪些DLL可以識別句子及其邏輯並正確組織句子嗎?就像把一個句子中的單詞變成正確的句子一樣。英語自然語句算法

如果它不可用,也許你可以建議我可以研究的搜索詞。

+0

這是一個棘手的問題要破解。 「自然語言處理」是您正在查找的搜索字詞。但正如我所說:這是一個非常棘手的問題。 – 2012-03-30 11:25:15

+0

爲什麼不添加「它是在JavaScript」:) – 2012-03-30 11:30:15

回答

1

這是一個非常複雜的問題,你要求。它被稱爲 計算語言學自然語言處理這是正在進行研究的主題。

這裏有一些鏈接,讓你開始:

我想你不能只是下載一個DLL,讓我流動:)

+0

借調。另外,請查閱https://www.coursera.org/nlp/class/index以獲得免費的自然語言處理在線課程,它們涵蓋了許多典型問題。 – Sprachprofi 2012-03-31 10:30:44

4

有東西叫做語言模型和正克。我會盡快解釋他們是什麼。 假設你有一個正確的英語句子巨大的選擇。讓我們挑一個:

The quick brown fox jumps over the lazy dog。現在我們來看看它中所有的單詞對(稱爲bigrams): (the, quick),(quick, brown),,(fox, jumps)等等...... 擁有龐大的句子集合,我們將有大量的bigrams。我們現在採取獨特的方法並計算它們的頻率(我們在正確的句子中看到它的次數)。 我們現在有,說
('the', quick) - 500
('quick', brown) - 53

二元語法與它們的頻率稱爲語言模型。它顯示了單詞的某種組合有多普遍。

所以你可以建立你的單詞的所有可能的句子,每一個考慮到語言模型的權重。一個最大重量的句子將成爲你所需要的。

在哪裏採取bigrams及其頻率?那麼,google has it。 您不僅可以使用一對單詞,還可以使用三個單詞等。它可以讓你建立更多像人一樣的句子。

+0

OMG ..這很多,我想我必須開始建立自己的數據庫,然後.. – Jason 2012-03-30 17:30:23