3

全角、全角、カタカナ、ひらがな、漢字、および代替文字の使用(たとえば、んの代わりにそ)の組み合わせが多すぎます。

Pythonにはjcconvというパッケージがあり、必要なことを実行するのに役立ちます。制限された単語リストを下に移動できるように、文字列を標準形式に変換したいと思います。

これはLuaで可能ですか?

4

1 に答える 1

0

ひらがな、カタカナ、および半角カタカナの間で文字列を変換できるようにするには、それぞれのアルファベット文字を異なるテーブルに格納し、それらの間にマッピングを追加します(インデックスまたはキーのいずれかによって)。

これは、ソース(リンク)から判断して、jcconvがこれを行う方法でもあります。

たとえば、ひらがなをカタカナに変換する場合は、次のようにします。

  • 各要素がとして定義されているテーブルを設定します[hiragana] = katakana
  • 文字列を文字ごとに繰り返し、その場合は置換します(これを正確に実行する小さなライブラリを見つけました:utf8.luaは、マッピングテーブルを受け入れる置換関数を提供します)。
于 2013-09-02T13:27:29.153 に答える