問題タブ [profanity]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
list - 「悪い言葉」フィルター
あまり技術的ではありませんが... 開発中の新しいサイトに悪い言葉のフィルターを実装する必要があります。したがって、データベースにフィードするための「良い」悪い言葉のリストが必要です...ヒント/方向性はありますか? グーグルで調べてみると、これが始まりでしたが、それ以上のものではありませんでした。
はい、この種のフィルターは簡単にエスケープできることは知っています...しかし、クライアントはクライアントの意志です!!! :-)
サイトは英語とイタリア語の両方の単語を除外する必要がありますが、イタリア語については、コミュニティで作成された「パロラッチェ」のリストを同僚に手伝ってもらうことができます :-) - メールで十分です。
助けてくれてありがとう。
php - 正規表現-単語と混合文字を一致させる(のみ)
スパム対策/悪意のあるフィルターを作成していますが、可能であれば必要です。
fr1&nd $のような混合文字で形成された単語のみを照合(検出)し、友達は照合しません
これは正規表現で可能ですか!?
よろしくお願いします!
iphone - iPhone 用 Objective C の基本的な冒涜フィルタ
敬虔な人は、冒とく的な表現をフィルタリングするという基本的な課題にどのように取り組みましたか。明らかに、すべてのシナリオに取り組むことはできませんが、防御の最前線として最も基本的なレベルで 1 つを用意することをお勧めします。
Obj-cで私は持っています
次に、各トークンをループして、各トークン内にキーワード (リストに約 400 個あります) が見つかるかどうかを確認します。
偽陽性の実現も問題です。単語が完全に一致する場合は、冒とく的な表現としてフラグが立てられます。それ以外の場合、冒とく的な単語が 3 つ以上見つかった場合でも、完全に一致するわけではなく、冒とく的な表現としてフラグが立てられます。
後で、この問題をより正確に解決する Web サービスを使用しますが、必要なのは基本的なことだけです。したがって、ペニスという単語を書いた場合、それはうん、いたずら、いたずら、悪い言葉が書かれます。
c# - C#で「悪い」単語の文字列を解析する最良の方法は何ですか?
私は次のようなことを考えています:
しかし、もっと良い方法があると確信しています。
前もって感謝します!
更新 わいせつを自動的に削除するつもりはありません...私のWebアプリでは、「悪い」と思われる単語が使用された場合に通知を受け取りたいです。次に、自分でレビューして、合法であることを確認します。ある種の自動フラグシステム。
python - 優れたPythonの冒とく的なフィルターライブラリとは何ですか?
https://stackoverflow.com/questions/1521646/best-profanity-filterと同様ですが、Pythonの場合、Webサービスではなく、ローカルで実行および制御できるライブラリを探しています。
(そして、冒とく的なフィルタリングに対する原則の基本的な反対意見を聞くことは常に素晴らしいことですが、ここでは特にそれらを探していません。冒とく的なフィルタリングは、言われているすべての有害なことを拾うことができないことを知っています。物事の問題は特に大きな問題ではありません。コンテンツの問題に対処するには、人間の意見が必要です。優れたライブラリを見つけて、それをどのように活用できるかを確認したいと思います。)
blacklist - スペインの冒とく的なブラックリスト
Railsアプリにブラックリストベースの冒とく的なフィルターを実装するという任務を負っています。ブラックリストベースのフィルタリングには多くの問題があることは知っていますが、決定は私の頭上で行われました。課題:フィルターにぶつかるスペイン語の冒とく的な表現の良いリストを探しています。英語の場合、活用形/複数形などをテキストファイルの1行に1つずつ網羅的にリストするリストに基づいて作成しています。そのようなリストはスペイン語のパブリックドメインに存在しますか?
profanity - コミュニティでフラグが立てられたコンテンツを処理する方法は?
ユーザー生成コンテンツがほとんどない多言語コミュニティで、フラグが立てられたコンテンツ(冒とく、人種差別、一般的な違法なものなど)を処理するために一般的に使用される方法はありますか?
英語以外のコンテンツがたくさんあるので、フラグを立てること自体を処理する唯一の方法は、コミュニティ自体によるクラウドソーシングであり、何らかの方法で、しきい値でフラグが立てられたものを自動的に非表示/削除します。しかし、虐待を止めるためにどのような方法を使用できますか?例:「私は彼が好きではありません。すべての人にこれを報告させて削除させます」
profanity - base36 IDの冒とく的な表現を除外するにはどうすればよいですか?
開発中のWebアプリケーションでbase36を使用したいのですが、IDがURLとしてユーザーに表示されるため、冒とく的な表現を除外したいと思います。誰かがこれを解決しましたか?それとも、これは本当の問題ですか?
データベースシーケンスの番号をスキップするだけで意味がありますか?
numeric - 数値 ID の冒とく的な表現を除外するにはどうすればよいですか?
開発中の Web アプリケーションで数値 ID を使用したいのですが、ID は URL としてユーザーに表示されるため、冒とく的な表現を除外したいと考えています。次のようなもの(それらが何であるかを理解するのはあなたに任せます):
誰かがこれを解決しましたか?これも本当の問題ですか?
データベース シーケンスで数字をスキップするだけで意味がありますか?
php - 値が配列にあるかどうかを確認します
これはおそらくv.easyですが、私のphpは非常に錆びています。私は悪い単語フィルターを実装する必要があります...私は現在これを持っています:
...そして悪い言葉が含まれている冒とく的な表現。問題は、ユーザーが入力した名前の一部にこれらの不適切な単語の1つが含まれているかどうかを確認できるようにしたいことです。現在取得しているのは、名前が正確に不適切な単語であるかどうかだけです。私はこれをしますか?
ありがとう