プロジェクトで「テキスト境界分析」を行う必要があります。
この仕事をするのに役立つかもしれないGoogleのリソースがあることを覚えていますが、名前やダウンロード先はよく覚えていません。
このリソースは、Google 検索からの集合統計データであることを覚えています。検索エンジンで人々がキーワードとして使用した多くの単語が含まれている可能性があります。(実際、この記事についてはかなり前に読んだので、そのリソースに何が含まれているかはわかりませんが、このリソースはテキストの境界を見つけるのに使用できると確信しています。)
誰かそれについて知っていますか?
ところで、テキスト境界の分析に役立つ他のリソースはありますか?
(Alex Martelli: ICU と Java を試しましたが、東洋言語の単語を見つけることができませんでした。)
(dwc : どうもありがとう、これは役に立つかもしれません。)