日本語と英語のテキストを含む文字列が与えられた場合、次のようにします。
- 日本語部分をひらがなからカタカナ、半角から全角に変換します。
- 文字列を単語で分割します (日本語のテキストは、単語を区切るためにスペースを使用しません)
私は現在、優れた iOS / OS X 文字列ライブラリ (何百もの複雑さとエッジ ケースに対応しています) を使用しています。
CFStringTransform
kCFStringTransformHiraganaKatakana
定数で。
enumerateSubstringsInRange:options:usingBlock:
NSStringEnumerationByWords
定数で。
検索はクライアントからサーバーに移動しているため、これらのメソッドの PHP または Python バージョンが必要です。