我打算組合一個可以用來查詢單詞同義詞的數據庫。數據庫最終會變成巨大的,所以我們的想法是讓事情保持快速。同義詞數據庫所需的設計建議
我一直在想如何做到這一點,但是我的數據庫設計技巧目前還沒有達到要求。
我最初的想法是將每個單詞存儲在一張表中,然後是另一個表格,其中每個單詞可以鏈接到另一個單詞,並且該表格可以被查詢。
我正在開發的應用程序允許用戶突出顯示一個單詞,然後鍵入或從數據庫中爲該單詞選擇一些同義詞。應用程序從用戶輸入中學習,所以如果有人突出顯示「car」並鍵入「motor」,數據庫將被更新,以便在關係不存在的情況下將其鏈接起來。
我不想要發生的是用戶輸入「shop」一詞並將其鏈接到單詞車。所以我想我需要爲每個關係增加一些權重。
最終會使用用戶輸入的同義詞,以便他們可以自動選擇與某個單詞一起使用的常用同義詞。較低的重量詞將不會被顯示出來,所以商店永遠不會是汽車的同義詞,除非它具有很高的重量,並且沒有人會這樣做。
以上是否正確?你能提供任何建議或改進?
什麼類型的應用程序是這樣嗎?桌面?網?此外,這是用於一般同義詞,還是針對特定的域,其中可能沒有可用的常用同義詞表作爲基準? – cdeszaq
我喜歡這個詞去同義詞表關係。如果輸入的是一個單詞而不是選定的單詞,那麼如果關係(「shop」代替「car」)的關係是由多於X個人輸入的話,那麼可能只會將關係添加到數據庫中? –
這是一個Web應用程序。 @JohnieKarr這就是我所想的越多,它被賦予的權重就越大,直到它有足夠的權重出現在列表中。 –