4

在測試發現服務後,至少對我來說似乎毫無用處,或者我可能會錯過某些東西。如何使用Watson Discovery獲取準確答案而不是整個文檔?

當我查詢時,它匹配文檔並返回整個文檔。如果我的文檔很大,那麼對於所有查詢,它將返回與查詢文本相匹配的整個文檔,這是無用的。

現在我需要爲每個查詢創建一個單獨的文檔嗎?

如果是這樣,API.AIWIT.AI是一個更好的選擇。

請清除我在這裏失蹤的東西!

+0

你是正確的,今天發現服務返回匹配查詢整個文件,按相關性排名的查詢。你能再描述一下你的用例嗎?像你正在建造什麼樣的應用程序? – catbelly

+0

我目前正在測試這項服務,如果您所說的話是正確的,那麼涉及很多手動工作,這不是做這些工作的最佳方式,我想我們仍然需要等待一段時間才能得到這些東西開發。 – johnrao07

回答

7

對於Discovery現在,您需要分割一次文檔以將其放入集合中,然後在Discovery中針對集合的任何查詢都會返回該分離文檔集合中的結果。所以如果你的文件沒有改變,這個分割應該是一次性的動作。
雖然自動識別查詢的較大文檔的相關部分的解決方案對於Discovery(注:我爲IBM Watson工作)是一個很好的考慮因素。

1

機智或api更類似於我們的watson會話服務。 發現是關於從語料庫中查找相關內容,而您提到的兩個以及我們的對話服務,更多地是使用NLP來理解查詢來響應對話。

+0

你已經部分回答了我的問題,另一部分是,我是否需要爲每個查詢創建數百個單獨的文檔,因爲目前從大型單個文檔查詢多個查詢是沒有用的,那麼使用Watson的另一種方式是什麼? – johnrao07

0

Watson Discovery服務允許在數百個文檔中進行認知搜索。 您可以使用Watson文檔轉換服務爲每個JSON格式的文檔自動創建PAU(可能的答案單元)的粒度。然後,您可以加載Watson發現服務中的Watson文檔轉換生成的PAU。 這樣,Watson Discovery將爲您的認知查詢返回確切的答案。

0

現在有一個passages參數可以傳遞給查詢API。截至撰寫本文時,它處於測試階段。它提供了文檔中的位置以及「段落」文本和分數。

{ 
 
    "document_id": "dd2a7574-c266-4587-812b-69a47aa271d6", 
 
    "passage_score": 23.961884787023948, 
 
    "passage_text": " query block name in many hints to specify the query block to which the hint applies. This syntax lets you specify in the outer query a hint that applies to an inline view.\n\nThe syntax of the query block", 
 
    "start_offset": 404, 
 
    "end_offset": 607 
 
},

相關問題