1

Mecab (NMecab と呼ばれる) の .NET ポートを使用して、日本語のひらがな、カタカナ、および漢字をローマ字に解析しようとしています。

これが私のコードです:

using NMeCab;    
MeCabTagger _tagger;

public string Parse(string input)
{
    _tagger = MeCabTagger.Create();
    _tagger.OutPutFormatType = "lattice";
    _tagger.LatticeLevel = MeCabLatticeLevel.Two;


    var output = _tagger.Parse(input);

    return output;
}

次の日本語テキストを使用して呼び出す場合Parse(input):「ども」

「ども助詞,接続助詞, , , ,ども,ドモ,ドモEOS」という出力が得られます。

「ども」のローマ字を探しています。

この SO answer で説明されているようにMecab を直接使用しようとしましたが、同じ出力が得られます。

4

1 に答える 1

2

私の知る限り、MeCab で使用されている辞書 (IPA、Jumandic、または Unidic) には、単語のローマ字表記が含まれていません。そして実際にはその必要はありません:

  1. さまざまな転写方式が存在します (例: ヘボン、訓令、99 式)。

  2. 語彙単位の発音に関する情報はすでに利用可能です (例: ドモ)。

独自の転写ルーチンを作成する必要があります... または、既存のカタカナローマ字転写モジュール (転写スキームと互換性があります) を探す必要があります...

于 2014-05-19T10:13:19.430 に答える