2009-12-31 81 views
0

什麼是一種智能的方式來存儲文本,以便以後可以智能地解析和翻譯。智能文本解析和翻譯

例如,員工是優秀的,因爲他可以找出自己的長處和短處以及熟悉自己。

上面可以是被示出爲之前評價的用戶通用的文字。如果用戶是男性(比如肖恩)或女性(比如瑪麗),則上述內容應翻譯如下。

瑪麗是優秀的,因爲她可以找出自己的長處和短處以及熟悉自己。

肖恩是優秀的,因爲他可以找出自己的長處和短處以及熟悉自己。

  1. 我們如何將評估標準與適當的地點或令牌持有者一起存儲在第一位。 (在上述情況下,員工應翻譯成員工姓名並根據其性別需要翻譯他或她自己的單詞)

  2. 是否有自動翻譯帶有上述信息的文本的機制。

+0

那麼,翻譯基於性別的單詞應該是很容易的......但是你會有多少其他單詞短語?[員工]?爲什麼是輸入文字?誰在寫這個?如果你在控制,你應該使用某種模板,而不是像「是優秀的,因爲可以識別自己......」 – mpen 2009-12-31 05:14:17

+0

輸入文本是由作者負責創建各種這樣的模板。不知道如何讓作者知道,所有正在被支持或可以被動態翻譯的變量參數列表。 – Joe 2009-12-31 07:00:57

回答

1

這是Natural Language Processing的一個非常廣泛的問題。有很多方法可以解決它,你問的問題似乎太寬泛。

如果我明白你的問題的正確部分可以這樣做是這樣的:

@variable {name}是優秀的@gender {他/她}可識別@gender {他/她}自己優點和缺點,並且對@gender {他/她自己}感到滿意。

或者:

@name是優秀的@he可以識別@his自己的長處和弱點,以及熟悉@himself。

...如果性別是主要問題。

+0

目前,變量參數列表僅限於名稱,性別(他,她,她,她自己)... – Joe 2009-12-31 07:13:42

1

我有一些經驗與工具的工作稱爲Grammatica,建立一個自定義用戶輸入練成像公式分析和評估引擎時。它可能不是你想要的複雜程度,但它是一個開始。這基本上使用了流行的代碼編譯器解析器使用的許多相同的概念。這絕對值得一試。

0

我同意Kornel,這個問題太廣泛了。你似乎在談論的是RDF和OWL可以成爲一個很好的起點的語義。閱讀關於建模語義學使用標記,你可以從那裏工作。

+0

與RDF相比,我更喜歡簡單的方法,我不太熟悉OWL。 – Joe 2009-12-31 07:03:10