近い将来、クロス言語の単語カウントを実装する必要があります。それが不可能な場合は、クロス言語の文字カウントを実装する必要があります。
単語数とは、テキストの言語を使用して、特定のテキストに含まれる単語の正確な数を意味します。テキストの言語はユーザーによって設定され、正しいと見なされます。
文字数とは、上記と同じ言語情報を使用して、特定のテキスト内に含まれる「単語の可能性がある」文字の数を意味します。
私は前者の数をはるかに好むが、それに伴う困難は承知している。また、後者の計算の方がはるかに簡単であることも認識していますが、可能であれば前者を非常に好みます。
英語だけを見ればよかったのですが、中国語、韓国語、英語、アラビア語、ヒンディー語など、すべての言語を考慮する必要があります。
私は良い怠惰なプログラマーなので、スタックオーバーフローがPHPでこれを行うための既存の製品/メソッドをどこから探し始めるかについて何か手がかりがあるかどうか知りたいです*
set_locale を使用した str_word_count が機能しないことを示す簡単なテストと、php.net の str_word_count ページの関数。