私は、「インターネット用語」でいっぱいのオンライン レビュー データに取り組んでいます。単語について語彙分析を行いたいと思います。簡単に言えば、インターネットで使用されている言語を考慮できるスペルチェッカーが必要です。いくつかの調査の後、私は2つのアプローチを見つけました:
- 編集距離の修正版であるテキストブリュー。
- サウンドベースのアプローチを採用したMetaphone。
PS。データを解析して、「lol」、「lmao」などのネット用語をきれいにします。私の唯一の懸念はスペルが間違っている単語であり、Java に取り組んでいます。