0
$:~/mgizapp/scripts$ ./plain2snt-hasvcb.py
Error, the input should be 
./plain2snt-hasvcb.py evcb fvcb etxt ftxt esnt(out) fsnt(out) evcbx(out) fvcbx(out)
You should concatenate the evcbx and fvcbx to existing vcb files

誰かがplain2sntスクリプトのすべてのacrane入力を説明できますか?スクリプトは、http://geek.kyloo.net/software/doku.php/mgiza:forcealignmentのワードアラインメント用のmgiza ++プログラムからのものです。

evcb =?#それはsource.vcbファイルですか?fvcb =?#それはtarget.vcbファイルですか?

esnt(out)=?fsnt(out)=?

evcbx(out)=?fvcbx(out)=?

答え

私はそれをうまく動かすことができました

$mkcls -n10 -psourcelangfile.vcb -Vsourcelangfile.vcb.classes
$mkcls -n10 -psourcelangfile.vcb -Vtargetlangfile.vcb.classes
$plain2snt sourcelangfile targetlangfile
$snt2cooc sourcelang_targetlang.cooc sourcelangfile.vcb targetlangfile.vcb sourcelangfile_targetlangfile.snt
4

1 に答える 1

2

GIZA++ とリンク先のページでの私の (同等ではない) 経験に基づいて、evcb と fvcb は既に生成した「英語」と「外国語」の語彙ファイルであり、etxt と ftxt は「英語」であると言えます。および「外国語」のテキスト入力。esnt と fsnt は、「英語」および「外国語」の文の出力ファイル (おそらく、vcb ファイルからの一意の識別子に置き換えられた単語を含む文) のようです。最後に、evcbx と fvcbx は、元の vocab ファイルを連結して拡張するための出力場所のようです。

これがお役に立てば幸いです。また、MGIZA を使用したことがある他の誰かが飛び込んで、私が間違っている場合は訂正してくれることを願っています。

于 2011-05-09T19:56:45.320 に答える