1

Stackoverflow を例にとると、悪い質問が飛び出さないようにするにはどうすればよいでしょうか? 以下のみを含む質問:

  1. スペース
  2. ちんぷんかんぷん
  3. 繰り返し文字
  4. 「fsdgh」などの文字の組み合わせ
  5. メタに関するジェフの投稿で説明されている他の組み合わせ。

これを Javascript で実行したい場合、投稿でそのような文字の組み合わせをプログラムで見つける方法はありますか? Meta に関するJeff の投稿では、そのようなシステムのヒューリスティックとパターンについて説明しています。

ユーザー登録やレート制限など、これに対抗する他の方法があるかもしれないことは理解していますが、純粋に検証とUXの観点から、サーバー側またはクライアント側のいずれかでそれを実現するにはどうすればよいですか? どちらの方法でも、システムが悪い投稿を期待しないことを良いユーザーに伝えるのに最適な方法です.

これは、たとえば、正規表現とループの組み合わせを使用できます。すべての要件をデプロイする必要はなく、おそらくサブセットで十分です。

4

1 に答える 1

1

以下のみを含む質問:

  1. スペース
  2. ちんぷんかんぷん
  3. 繰り返し文字
  4. 「fsdgh」などの文字の組み合わせ
  1. 投稿のテキストを取得し、trim(); を実行します。その上で(空白を削除します)、テキストのサイズがゼロになった場合、投稿にはスペースのみが含まれていました. 悪いです。
  2. 難しいのは、「the、of、if、it」などの一般的な単語やフレーズを検索することです。多くが欠落している場合、またはすべてが欠落している場合は、悪い可能性があります。
  3. 私は、英語で 2 つ以上の文字が連続して繰り返される単語はないと思います。したがって、テキストを解析するときに、最後に見た文字が何であったかを覚えておいてください。次の文字が最後に見た文字である場合、フラグが設定されている場合は、次の文字が最後に見た文字です。悪い投稿です。
  4. 上記と同じ考え方ですが、文字の長さはあるが母音のない単語を検索し、非母音の連鎖が最も長い単語を調べます。これ以上何かを見つけた場合、それは悪い投稿です.

コンピュータサイエンティストは英語やほとんどすべての話し言葉を知っているため、これらのほとんどは困難です.

あなたが指摘したように、これらの問題を処理する唯一の良い方法は、改造、登録などです.

おっと、あなたが正規表現を使いたいとは思いませんでした...しかし、それでもどの観点からもそれを行うのは難しいです。(おもう)

于 2013-05-01T14:40:21.017 に答える