単語の単純なホワイトリストでうまくいくとは思えません。世の中には、ホワイトリストが決してブロックしない多くのものに対する婉曲表現がかなりあります (たとえば、「彼は雑草のように成長しています」は問題ありませんが、「彼は雑草を育てています」はそうではありません)。そして、基本的な「会いたいですか?」は言うまでもありません。ミーティングがゲーム内で行われるのであれば問題ありませんが、ゲーム外で行われると非常に危険です。次に、珍しい単語、外来語、またはタイプミスした単語をブロックするという問題もあります。これにより、チャット システムがイライラして使用されなくなる可能性があります。
私の意見では、アクティブで有能な人間のモデレーターが提供するセキュリティに匹敵する方法は絶対にありません. もちろん、チャット トラフィックの量とリアルタイムの要件によっては、これに人間を使用することにはかなりの数の実際的な問題があります。ただし、アプリケーションが子供を対象としていることを考えると、コストははるかに高くなりますが、人間によるモデレーションは十分に受け入れられる可能性があります。
2 番目の選択ですが、人間のモデレーションの能力とはかけ離れていますが、Bogofilterなどの統計フィルターを使用することです。これは、適切にトレーニングすれば、任意のテキストを喜んでソートします。また、ブラックリストは、小さな子供が知らない (通常は知っている) 単語を含むメッセージを即座に削減するのにも役立ちます。また、電話番号、電子メール、住所、Web リンクなどを含むメッセージを除外する一連のフィルターも必要です。
おそらく、有効性とコストの比率が最も高い方法は、複数の統計フィルターによって支援された人間のモデレーターを使用して、時間をより有効に活用することです。ただし、悪意のあるユーザーがいる場合 (つまり、教室に同年代の子供以外がいる場合)、疑わしいものや危険なものが通過しないようにする方法はないことに注意してください。