2011-03-21 89 views
0
$:~/mgizapp/scripts$ ./plain2snt-hasvcb.py 
Error, the input should be 
./plain2snt-hasvcb.py evcb fvcb etxt ftxt esnt(out) fsnt(out) evcbx(out) fvcbx(out) 
You should concatenate the evcbx and fvcbx to existing vcb files 

有人可以解釋所有的plain2snt腳本acrane投入?該腳本是從mgiza ++程序用於從http://geek.kyloo.net/software/doku.php/mgiza:forcealignment有人可以解釋這個mgiza腳本是如何工作的嗎?

evcb字對齊=? #is它是source.vcb文件? fvcb =? #is它是target.vcb文件?

esnt(下)=? fsnt(out)=?

evcbx(下)=? fvcbx(out)=?

ANSWER

我設法根據我(不相等)與GIZA經驗++和你鏈接到網頁它的工作

$mkcls -n10 -psourcelangfile.vcb -Vsourcelangfile.vcb.classes 
$mkcls -n10 -psourcelangfile.vcb -Vtargetlangfile.vcb.classes 
$plain2snt sourcelangfile targetlangfile 
$snt2cooc sourcelang_targetlang.cooc sourcelangfile.vcb targetlangfile.vcb sourcelangfile_targetlangfile.snt 

回答

1

,我會說evcb和fvcb是您已經生成的「英文」和「外文」詞彙文件以及etxt和ftxt是「英文」和「外文」文本輸入。似乎esnt和fsnt是「英語」和「外語」句子輸出文件(可能是句子的單詞由vcb文件中的唯一標識符替換)。最後,evcbx和fvcbx似乎是輸出位置,用於通過串聯擴充原始詞彙文件。

我希望這可以幫助,我希望別人誰在使用MGIZA可以跳和糾正我,如果我錯了。

相關問題