Mecab (NMecab と呼ばれる) の .NET ポートを使用して、日本語のひらがな、カタカナ、および漢字をローマ字に解析しようとしています。
これが私のコードです:
using NMeCab;
MeCabTagger _tagger;
public string Parse(string input)
{
_tagger = MeCabTagger.Create();
_tagger.OutPutFormatType = "lattice";
_tagger.LatticeLevel = MeCabLatticeLevel.Two;
var output = _tagger.Parse(input);
return output;
}
次の日本語テキストを使用して呼び出す場合Parse(input):「ども」
「ども助詞,接続助詞, , , ,ども,ドモ,ドモEOS」という出力が得られます。
「ども」のローマ字を探しています。
この SO answer で説明されているようにMecab を直接使用しようとしましたが、同じ出力が得られます。