28

多くのユーザーやフォーラムプログラムは、自動電子メールアドレスをより困難に隠そうとして、難読化によってそれらを隠そうとしています-@は「at」とに置き換えられます。「ドット」に置き換えられるので

 team@stackoverflow.com

今になる

team at stackoverflow dot com

私は正規表現の専門家ではなく、本当に興味があります-そのような難読化は本当に自動収穫を難しくしますか?そのような難読化されたアドレスを自動的に識別することは本当にはるかに難しいですか?

4

12 に答える 12

34

絶対!

少し前にこの記事を読みましたが、さまざまな方法がどれほど効果的であるか (および相対的な程度) を示しています。すでに逆になっている文字列を逆にすることは、現時点ではかなりまともな保護のようです。

次のコード サンプル:

<style type="text/css">
   span.codedirection { unicode-bidi:bidi-override; direction: rtl; }
</style>

<p><span class="codedirection">moc.etalllit@7raboofnavlis</span></p>

少なくとも読めるように電子メールを出力します。

そうは言っても、それはほとんど軍拡競争です。しかし、時代を先取りしている限り、難読化されていない通常のアドレスよりも、アドレスを取得するのに手間がかかります。

于 2009-08-11T10:03:33.860 に答える
11

難読化手法は、キャプチャと同じカテゴリに分類されます。それらは信頼性が低く、ボットよりも通常のユーザーを傷つける傾向があります.

Javascript の難読化は称賛されているようですが、特効薬ではありません。現在、電子メール スニッフィングのためにブラウザを自動化することはそれほど難しくありません。ブラウザで表示できれば収穫可能です。ボットがブラウザー ウィンドウのスクリーンショットを撮り、OCR を使用してアドレスを抽出し、100 万ドル規模の難読化手法を打ち破るボットを想像することさえできます。

メールを難読化する場所と理由によっては、これらの手法が役立つ場合があります。

  • メールの可視性を制限する: Web サイト/フォーラムのメールを匿名ユーザーや新規ユーザー (これまでの活動や投稿がほとんどまたはまったくない) に非表示にしたり、完全に非表示にしてメンバー間のメール連絡を組み込みのプライベート メッセージング機能に置き換えたりすることもできます。 .

  • 専用のスパムフィルター付きメールを使用してください: スパムメールを受信しますが、この特定のアドレスに限定されます. これは、電子メール アドレスを任意のユーザーに公開する必要がある場合に適したトレードオフです。

  • お問い合わせフォームを使用する: ボットはフォームへの入力がかなり得意ですが、フォームへの入力が得意すぎることが判明しました。ヒドゥン フィールド テクニックを使用すると、コンタクト フォームから来るほとんどのスパムをフィルタできます

于 2009-08-11T10:44:06.617 に答える
8

この種の難読化を見ると、すぐに正規表現も思い浮かびます。このように「難読化」された電子メールを収集するのは簡単なことです。

私はかつて、自分のメールアドレスを次のように公開するというアイデアを思いつきました。

ここに私を郵送することができます:

string myEmail = "";
myEmail = myEmail
          .Append ("myname")
          .Append ("@")
          .Append ("domain")
          .Append (".")
          .Append ("com");

それを理解しない人は誰でも、私の基本的な知能検査に失敗しました。

于 2009-08-11T09:43:45.663 に答える
6

スパマーやユーザーが電子メール アドレスを特定することは困難です。

電子メールの難読化またはアドレス変更に関するウィキペディアの素晴らしい記事

ボットやスパマーから電子メールを隠す一般的な方法の 1 つは、電子メール アドレスを含む画像を作成することです。たとえば、Facebookはこれを行います。現在、電子メールに画像を使用することは本質的にアクセシビリティに悪影響を及ぼします。テキスト リーダーは画像を読むことができないからです。しかし、それ以外の場合でも、そのような電子メール画像をかなりうまくデコードする無料の文字認識プログラムがいくつかあります。

ここから

于 2009-08-11T09:44:58.983 に答える
5

本当にスパムに役立つかどうかはわかりませんが、mailto: タグ/電子メールのEscape Encode Obfuscationが好きになることを学びました。タグの例:

<a href="%6D%61%69%6C%74%6F%3A%74%65%61%6D%40%73%74%61%63%6B%6F%76%65%72%66%6C%6F%77%2E%63%6F%6D">&#116;&#101;&#97;&#109;&#64;&#115;&#116;&#97;&#99;&#107;&#111;&#118;&#101;&#114;&#102;&#108;&#111;&#119;&#46;&#99;&#111;&#109;</a>

メール team@stackoverflow.com

于 2009-08-11T09:59:29.627 に答える
4

玄関のドアに「ADTで保護された」ステッカーを貼るのと同じです。

それは才能のある泥棒があなたの家に入るのを防ぎますか?もちろん違います。

それは、鍵のかかっていないドアと窓のiPodを備えた隣の家を、より説得力のあるターゲットにするでしょうか?かなりありそうです。

単純な難読化されていない電子メールスクレーパーは、大量の電子メールをそのまま取得します。おそらく、非常に一般的な難読化方法を選択するための非常に単純な正規表現は、努力する価値があります。それを過ぎると、ますます少ない割合の電子メールを解読しようと多くの時間を費やしています。

言うまでもなく、巧妙な難読化を行うことはおそらく価値があります。

ちなみに、スパムフィルターが機能するgmailを使用しているため、私のメールは何年もの間プレーンテキストで公開されています。

于 2009-08-11T14:31:08.990 に答える
3

これまでALAソリューションについて誰も言及しなかったのはなぜだろうと思っていました。

Roel Van Gils は、 2007 年にGraceful Email Obfuscationに関する記事を書きました。

Graceful Email Obfuscation は、お問い合わせフォームのフォールバックを使用したJavaScript の電子メール難読化手法です。

  1. 電子メール アドレスは、連絡先フォームにアクセスする URL に変換し、ROT13 変換を適用することで難読化されます。
  2. mailto:mail@example.comcontact/mail+example+comcontact/znvy+rknzcyr+pbz
  3. JavaScriptcontact/znvy+rknzcyr+pbzを介して変換されますmailto:mail@example.com
  4. 利用可能な JavaScript がない場合は、ブラウザーがcontact/znvy+rknzcyr+pbzフォールバックとして開きます。お問い合わせフォームは、URL によりメールの送信先を認識します。

http://www.alistapart.com/articles/gracefulemailobfuscation/

于 2011-09-07T08:35:58.723 に答える
1

文字通りの答えを提供するために、はい、難読化されたアドレスを収集することは、標準化されたアドレスを収集することよりも困難です。本当の問題は、ハーベスターが余分な労力を費やすかどうか、そしてハーベスターに対する(メジャー?マイナー?)バリアがユーザーにとって起こりうる問題に値するかどうかです。

アドレスをスクランブルしたり、標準形式から転置したりする場合は、少なくとも同じサイトで、一貫した方法でアドレスを転置することは避けてください。

たとえば、大規模なコミュニティサイトのすべてのメールアドレスがマークアップで逆にされ、CSSで適切にレンダリングされたり、トークンが置き換えられたり(@が'at'になる)、またはその他の予測可能な方法である場合、ハーベスターはあなたのサイト。

このように考えてください。サイト全体でコードを「スクランブル」するのに1行のコードしか必要ない場合、ハーベスタはサイトのコードを「スクランブル解除」するのに1行のコードしか必要ありません。大ざっぱに言えば。

私の意見では、スパムはそのような問題になり、非常に多くのDBが引き渡されたため、アドレスを隠すことはできません。代わりに、スパムの分類とブロックに役立つDefensioやAkismetなどを検討してください。

于 2009-08-11T14:25:36.173 に答える
1

それは確かに難しくなりますが、非常に多くの非常にスマートなスクレイパーが存在するため、大規模なスパマーは高品質のスパム ツールを使用しているため、おそらくあまり役​​に立ちません。

于 2009-08-11T09:58:33.277 に答える
1

スパマーと戦うには?脳のないもの (コンピューターなど) に対して、メール アドレスを認識しにくくします。

英語を話さない人は友達です。ユーザー ベースが英語を話さないコミュニティの場合は、他の言語を使用した難読化に切り替えてください。一部の電子メール ハーベスターはポーランド語またはドイツ語を知っていますが、ほとんどのハーベスターは英語しか理解できない可能性があります。

英語を離れることができない場合は、いくつかの説明的なフレーズに切り替えてください。たとえば、「メッセージを送信するには、住所フィールドにチームを書いてください。記号 AT を入力してください。サイトの名前を書いてください。」.

于 2009-08-11T09:59:11.107 に答える
1

私は解決策を持っています、まあ、もっと理論です。問題は、ボットがページを解析することです。テキストを取得できます。Javascript を介して洗練された方法でページに挿入されている場合でも。

だから、あなただけのCSS3疑似要素!リンクにはなりませんが、メールは表示され、実際のテキストにはなりません。このようなもの:

.email::after{ content:'myemail@gmail.com'; }

繰り返しますが、これは理論です。これらの邪悪な人々がどこまでそれを手に入れることができるかはわかりませんが、これはかなり安全だと思います. (彼らがCSSファイルを解析しない限り、私はそうは思わない)

于 2013-04-24T19:57:00.903 に答える
0

ある程度難しくなりますが、今日でもユーザーが使用する単純なもの ([dot][at]) は時代遅れであり、スパマーが単純な正規表現を使用して簡単に取得できます。

画像のように単純なものを使用すると、エンコードされた電子メール ID を「解読」する努力をしなくても、意図した人間の読者にとって役に立ち、読みやすくなります。

連絡先メールアドレス:

文字認識を備えたスパムボットにまだ偏執的である場合は、このようなものが効果的です.

目の錯覚を利用して、コンピュータ ビジョンでは簡単に理解できない人間の心の文字を完成させます。CAPCHA のようなオーバーレイを適用することも役に立ちますが、そこまでする必要はないと思います。

于 2016-09-02T02:49:23.680 に答える