問題タブ [giza++]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - giza++ に関するチュートリアルはありますか?
「readme」ファイルの URL が無効です ( http://www.fjoch.com/mkcls.htmlおよびhttp://www.fjoch.com/GIZA++.html )。giza++ に関する適切なチュートリアルはありますか? または、完全なドキュメントがある代替手段はありますか?
c++ - giza 1.0.5 のコンパイル時のエラー
現在、 http://code.google.com/p/giza-pp/downloads/detail?name=giza-pp-v1.0.5.tar.gzからダウンロードした GIZA++ をコンパイルしようとしています。しかし、make コマンドを実行するたびに、次のエラーが常に発生しました。
何が悪いのか本当にわからないのですが、誰か助けてもらえますか?
Fedora 14 と g++ バージョン 4.5.1 を使用しています
ご協力いただきありがとうございます
machine-learning - Giza++からの悪い結果と評価
ウィンドウで giza++ を使用しようとしました (Cygwin コンパイラを使用)。私はこのコードを使用しました:
//ソース言語がフランス語で、ターゲット言語が英語であるとします
しかし、giza++ から出力ファイルを取得して出力を評価した後、結果があまりにも悪いことに気付きました。
私の評価結果は次のとおりです。
リコール = 0.0889
精度 = 0.0990
F_MEASURE = 0.0937
AER = 0.9035
誰かがその理由を知っていますか?いくつかのパラメーターを忘れてしまった、またはいくつかのパラメーターを変更する必要があることが理由でしょうか?
つまり:
最初に膨大な量のデータで giza++ をトレーニングし、次に小さなコーパスでテストし、その結果を目的の配置 (GOLD STANDARD) で比較したかったのですが、Web にドキュメントや有用なページが見つかりません。
役に立つドキュメントを紹介できますか?
したがって、小さなコーパス (447 文) で実行し、目的のアライメントで結果を比較しました。これは正しい方法だと思いますか?
また、次のようにコードを変更したところ、より良い結果が得られましたが、まだ良くありません:
GIZA++ -S testlowsf.f.vcb -T testlowde.e.vcb -C testlowsf.f_testlowde.e.snt -m1 5 -m2 0 -mh 5 -m3 5 -m4 0 -CoocurrenceFile 入力cooc.cooc -o 辞書 -model1dumpfrequency 1 -model4smoothfactor 0.4 -nodumps 0 -nsmooth 4 -onlydumps 1 -p0 0.999 -diagonal はい -final はい
評価結果 :
// A が GIZA++ の結果であり、G がゴールド スタンダードであるとします。As と Gs は、A And G ファイルの S リンクです。Ap と Gp は、A ファイルと G ファイルの p リンクです。
RECALL = 交差 Gs/Gs = 0.6295
PRECISION = Ap 交差 Gp/A = 0.1090
FMEASURE = (2*精度*再現率)/(再現率 + 精度) = 0.1859
AER = 1 - ((Gs と交差する + Ap と Gp が交差する)/(A + S)) = 0.7425
その理由を知っていますか?
machine-learning - Giza ++でトレーニングとテストのステップを実行するにはどうすればよいですか?
人工知能の手法では、2 段階のトレーニングがあります。これらの段階はデータとテストです。
トレーニング段階では、システムに大量のデータを与え、通常は少量のデータでテストします。次に、出力を評価します。
問題は、このトレーニングを GIZA++ に組み込まれた組み込み機能を使用して実行できるか、それとも別のアプリケーションを作成する必要があるかということです。
別のアプリケーションを作成する必要がある場合、既に作成されたアプリケーションを提案してくれる人はいますか? それとも説明書?注: 統計的機械翻訳ではなく、アラインメント プログラムが必要です
観測されていないデータでテストできるように、Giza++ でトレーニングしたいと思います。
前もって感謝します。
c++ - mgizaのコンパイルエラー
最新バージョンの mgiza++ (0.7.1) を Ubuntu マシンにインストールしようとしていますが、次のエラーが発生します。次のコマンドを実行して Boost をインストールしました: sudo apt-get install libboost-all-dev
./configure を実行した後
makeを実行した後
Make ファイルで Boost ライブラリを正しくリンクしていないと思われます。ご意見がありましたらお知らせください。
makefile - Giza++ のインストール、FORTRAN の問題
Ubuntu 12.10 64 ビットに Giza++ と Moses をインストールしようとしています。私は同じ問題を抱え続けています:
................................................
グーグルはあまり役に立ちませんでした。この問題を解決する方法のヒントをいただければ幸いです。-fPIC で再コンパイルするにはどうすればよいですか?
alignment - ノイズの多いテキスト コーパスにおける文の分割と整列
私は、アラビア語とペルシア語で整列された約 100,000 の段落を含む対訳コーパスを持っています。
私のコーパスは、パラグラフ同士が完全に翻訳されていないノイズの多いコーパスです (つまり、アラビア語のパラグラフの一部がペルシア語に翻訳されておらず、句読点も一致していません)。
段落を文に分けるために句読点を使ったのですが、文数が合っていません。
その後、Microsoft Aligner を使用して文章を整列させましたが、結果は本当に間違っています。
コーパスの文をどのように分割して整列させるのですか?
nlp - GIZA ++を使用して単語の整列に多くのメモリと時間を消費するmkclsを解決するにはどうすればよいですか?
Europarlコーパスのbitextsの単語を揃えるためにGIZA++を使用しています。
を使用してアライメントモデルをトレーニングする前に、 mkclsGIZA++
スクリプトを使用して、隠れマルコフモデルアルゴリズムに必要なクラスを作成する必要があります。
小さいサイズの1000行のコーパスで試してみましたが、正常に動作し、数分で完了しました。今私は150万行のコーパスでそれを試していますそしてそれは私のCPUの1つの100%を占めています(Six-Core AMD Opteron(tm) Processor 2431 × 12)
クラスを作成する前に、トークン化し、すべての大文字を低くし、40語を超える行を除外するために必要な手順を実行しました。
mkcls
GIZA ++で同様の経験をしている人はいますか?それはどのように解決されますか?Europarlコーパスで同じことをした人がいたら、実行するのにどれくらい時間がかかりましたmkcls
か?
g++ - giza stream.h エラー 致命的
ここからギザをインストールするとき:
解凍して「make」を実行すると、次のエラーが表示されます。
これを解決する方法を知っている人はいますか?