2012-07-20 106 views
0

我想爲我最後一年的碩士學位設計一個語義搜索引擎。我一直在網上和學術論文上隨便閱讀大量的文章,所以我在這個領域並不是一個完全的技術。語義搜索引擎

我的目標是構建一個語義搜索引擎,將HTML內容解析爲等價的RDF三元組,將三元組存儲在三重存儲中,引擎將嘗試響應使用SPARQL觸發的查詢。與其他學生不同,我想做一些開箱即用的事情。所以,我決定構建一個語義搜索引擎。

現在,我有一個運行搜索引擎使用Solr執行關鍵字搜索,我想要做的是語義搜索。我知道一些關於Web 3.0的開源工具,但不確定它們是否與Solr兼容。

所以,你能否給我提供一些建設相同的幫助。

謝謝。 Regards

+1

嗯,首先,您應該澄清或定義「語義搜索」的含義。那麼你可以認爲RDF可能會幫助你(或者不可能)。 嘗試在Google上搜索「leonardo da vinci death」。這是「語義搜索」的例子嗎?如果你問我,我肯定會說是。那是你想要達到的目標嗎? – castagna 2012-07-22 07:20:52

+0

某種程度上,YES.Thats我想要的。 感謝您的回覆。 – srijla 2012-07-22 09:12:54

+0

我該如何實現? – srijla 2012-07-22 09:13:19

回答

0

雖然聽起來很難,但是你將無法捕捉到一切。

  1. 您需要大量的數據。當然,已經有很多數據按照你可能使用的owl和rdf等格式排列(例如WordNet,Yago,GeoNames等),但它們雖然規模很大,但只關注可能話語的很小部分宇宙。

  2. 開發一個好的語義搜索需要大量的資源和大腦的力量。項目,例如德國人工智能研究中心的KompParse,只關注一小部分人類交談(閒話或購買傢俱),現在已經和幾位員工一起工作了好幾年,現在仍然「不錯」。

  3. 理解語義已經在不同的搜索引擎中實現,例如google或wolfram alpha。所以這個話題甚至可能不像你想象的那樣「開箱即用」。

所以我會和user723630一起去,強烈建議你關注一個小題目。你仍然會獲得很多,但你不會感到沮喪。