問題タブ [giza++]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
11269 参照

nlp - giza++ に関するチュートリアルはありますか?

「readme」ファイルの URL が無効です ( http://www.fjoch.com/mkcls.htmlおよびhttp://www.fjoch.com/GIZA++.html )。giza++ に関する適切なチュートリアルはありますか? または、完全なドキュメントがある代替手段はありますか?

0 投票する
1 に答える
405 参照

c++ - giza 1.0.5 のコンパイル時のエラー

現在、 http://code.google.com/p/giza-pp/downloads/detail?name=giza-pp-v1.0.5.tar.gzからダウンロードした GIZA++ をコンパイルしようとしています。しかし、make コマンドを実行するたびに、次のエラーが常に発生しました。

何が悪いのか本当にわからないのですが、誰か助けてもらえますか?

Fedora 14 と g++ バージョン 4.5.1 を使用しています

ご協力いただきありがとうございます

0 投票する
1 に答える
435 参照

machine-learning - Giza++からの悪い結果と評価

ウィンドウで giza++ を使用しようとしました (Cygwin コンパイラを使用)。私はこのコードを使用しました:

//ソース言語がフランス語で、ターゲット言語が英語であるとします

しかし、giza++ から出力ファイルを取得して出力を評価した後、結果があまりにも悪いことに気付きました。

私の評価結果は次のとおりです。

リコール = 0.0889

精度 = 0.0990

F_MEASURE = 0.0937

AER = 0.9035

誰かがその理由を知っていますか?いくつかのパラメーターを忘れてしまった、またはいくつかのパラメーターを変更する必要があることが理由でしょうか?

つまり:

最初に膨大な量のデータで giza++ をトレーニングし、次に小さなコーパスでテストし、その結果を目的の配置 (GOLD STANDARD) で比較したかったのですが、Web にドキュメントや有用なページが見つかりません。

役に立つドキュメントを紹介できますか?

したがって、小さなコーパス (447 文) で実行し、目的のアライメントで結果を比較しました。これは正しい方法だと思いますか?

また、次のようにコードを変更したところ、より良い結果が得られましたが、まだ良くありません:

GIZA++ -S testlowsf.f.vcb -T testlowde.e.vcb -C testlowsf.f_testlowde.e.snt -m1 5 -m2 0 -mh 5 -m3 5 -m4 0 -CoocurrenceFile 入力cooc.cooc -o 辞書 -model1dumpfrequency 1 -model4smoothfactor 0.4 -nodumps 0 -nsmooth 4 -onlydumps 1 -p0 0.999 -diagonal はい -final はい

評価結果 :

// A が GIZA++ の結果であり、G がゴールド スタンダードであるとします。As と Gs は、A And G ファイルの S リンクです。Ap と Gp は、A ファイルと G ファイルの p リンクです。

RECALL = 交差 Gs/Gs = 0.6295

PRECISION = Ap 交差 Gp/A = 0.1090

FMEASURE = (2*精度*再現率)/(再現率 + 精度) = 0.1859

AER = 1 - ((Gs と交差する + Ap と Gp が交差する)/(A + S)) = 0.7425

その理由を知っていますか?

0 投票する
1 に答える
919 参照

machine-learning - Giza ++でトレーニングとテストのステップを実行するにはどうすればよいですか?

人工知能の手法では、2 段階のトレーニングがあります。これらの段階はデータとテストです。

トレーニング段階では、システムに大量のデータを与え、通常は少量のデータでテストします。次に、出力を評価します。

問題は、このトレーニングを GIZA++ に組み込まれた組み込み機能を使用して実行できるか、それとも別のアプリケーションを作成する必要があるかということです。

別のアプリケーションを作成する必要がある場合、既に作成されたアプリケーションを提案してくれる人はいますか? それとも説明書?注: 統計的機械翻訳ではなく、アラインメント プログラムが必要です

観測されていないデータでテストできるように、Giza++ でトレーニングしたいと思います。

前もって感謝します。

0 投票する
1 に答える
1418 参照

c++ - mgizaのコンパイルエラー

最新バージョンの mgiza++ (0.7.1) を Ubuntu マシンにインストールしようとしていますが、次のエラーが発生します。次のコマンドを実行して Boost をインストールしました: sudo apt-get install libboost-all-dev

./configure を実行した後

makeを実行した後

Make ファイルで Boost ライブラリを正しくリンクしていないと思われます。ご意見がありましたらお知らせください。

0 投票する
1 に答える
488 参照

makefile - Giza++ のインストール、FORTRAN の問題

Ubuntu 12.10 64 ビットに Giza++ と Moses をインストールしようとしています。私は同じ問題を抱え続けています:

................................................

グーグルはあまり役に立ちませんでした。この問題を解決する方法のヒントをいただければ幸いです。-fPIC で再コンパイルするにはどうすればよいですか?

0 投票する
1 に答える
302 参照

alignment - ノイズの多いテキスト コーパスにおける文の分割と整列

私は、アラビア語とペルシア語で整列された約 100,000 の段落を含む対訳コーパスを持っています。

私のコーパスは、パラグラフ同士が完全に翻訳されていないノイズの多いコーパスです (つまり、アラビア語のパラグラフの一部がペルシア語に翻訳されておらず、句読点も一致していません)。

段落を文に分けるために句読点を使ったのですが、文数が合っていません。

その後、Microsoft Aligner を使用して文章を整列させましたが、結果は本当に間違っています。

コーパスの文をどのように分割して整列させるのですか?

0 投票する
2 に答える
579 参照

nlp - GIZA ++を使用して単語の整列に多くのメモリと時間を消費するmkclsを解決するにはどうすればよいですか?

Europarlコーパスのbitextsの単語を揃えるためにGIZA++を使用しています。

を使用してアライメントモデルをトレーニングする前に、 mkclsGIZA++スクリプトを使用して、隠れマルコフモデルアルゴリズムに必要なクラスを作成する必要があります。

小さいサイズの1000行のコーパスで試してみましたが、正常に動作し、数分で完了しました。今私は150万行のコーパスでそれを試していますそしてそれは私のCPUの1つの100%を占めています(Six-Core AMD Opteron(tm) Processor 2431 × 12)

クラスを作成する前に、トークン化し、すべての大文字を低くし、40語を超える行を除外するために必要な手順を実行しました。

mkclsGIZA ++で同様の経験をしている人はいますか?それはどのように解決されますか?Europarlコーパスで同じことをした人がいたら、実行するのにどれくらい時間がかかりましたmkclsか?

0 投票する
1 に答える
571 参照

g++ - giza stream.h エラー 致命的

ここからギザをインストールするとき:

解凍して「make」を実行すると、次のエラーが表示されます。

これを解決する方法を知っている人はいますか?