日本語のテキストを解析しようとしていますが、出力エンコーディングがわかりません。
これは私が得ている出力です:
これは ̾��,����,*,*,*,*,*
本 ̾��,����,*,*,*,*,*
です ̾��,����,*,*,*,*,*
。 ̾��,������³,*,*,*,*,*
EOS
私が取った手順:
git clone https://github.com/taku910/mecab
cd mecab/mecab
./configure --enable-utf8-only --with-charset=utf8
make
sudo make install
mecab -o ~/Desktop/output.txt ~/Desktop/input.txt
、ここinput.txt
に「これは本です。」が含まれています。
OSX 10.15.3 の使用