有沒有某種算法或概念,可以幫助解決以下問題?字符串含義比較
說我有兩段文字,代碼段1和代碼段二。
片段1內容如下:
「狗嚇得不敢出門到風暴」
片段2如下:
「犬被嚇倒進入陰雨天氣「
有沒有一種方法可以比較使用某種算法的片段,或者某種字符串理論系統?我想知道在解決這個問題之前是否有任何種類的系統解決了這個問題。
更新: 好的,舉一個更具體的例子,說我想減少票務系統中的錯誤數量。我想做一些掃描,看看是否有任何相關或相似的門票。我想知道根據票證的主體來確定問題的最佳系統方式。 Levenshtein距離算法並不是特別有效,因爲它不會知道溼度和幹度之間的差異。
此存儲庫對您的問題有一個詞嵌入方法:https://bitbucket.org/yunazzang/aiwiththebest_byor – Aaron