問題タブ [bots]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
seo - Googlebot に正しい GEOIPed コンテンツを取得させる方法は?
わかった。この問題は頭を悩ませています。そして、決定的な答えがあるかどうかさえわかりません。
mycompany.comという Web サイトがあります。これは、英国ベースのコンテンツを含む、英国ベースのサイトです。Google はそのことを知っており、SEO を大量に実行しました。すべては順調です。
ただし、私の会社である GLOBAL ブランドを再開しようとしているため、さまざまな国のローカル コンテンツ用に mycompany.com/uk、mycompany.com/us、および mycompany.com/au が必要です。GEOIP を使用しているため、米国の誰かが mycompany.com をロードすると、mycompany.com/us などにリダイレクトされます。
これら 3 つの国 (米国、オーストラリア、または英国) のいずれにも属していないユーザーは、英国のサイトを取得します。
これで問題ありませんが、mycompany.com にある大量の Google ジュースを失いたくないのです。さらに悪いことに、Google ボットは 100% 米国に拠点を置いているように見えるため、米国のサイト (3 つのうち最も重要度の低いサイト) がメインのサイトのように見えます。
ボットを検出し、英国のコンテンツを提供することを検討しましたが、Google が私たちを叩く可能性があるようです.
他の誰かがこの状況に遭遇し、解決策を持っていますか?
web-crawler - サイトのデフォルトページのみを許可するrobot.txtを設定する方法
http://example.comにサイトがあるとします。ボットにホームページを表示させたいのですが、スパイダーには意味がないため、他のページはブロックする必要があります。言い換えると
http://example.comとhttp://example.com/は許可する必要がありますが、 http://example.com/anythingとhttp://example.com/someendpoint.aspxはブロックする必要があります。
さらに、特定のクエリ文字列がホームページにパススルーできるようにできれば素晴らしいと思います: http ://example.com?okparam=true
security - ボットが攻撃するとき!
CAPTCHA 以外によく使われているスパム防止方法は何ですか?
email - HTMLまたはさまざまな奇妙なエンコーディングである可能性のある生の電子メールメッセージを解析し、それをプレーンテキストに変換します。たとえば、マツが表示する方法です
これを行う理由は、ボットに電子メールで送信された指示を簡単に解析できるようにするためです。これは、majordomo がサブスクライブやサブスクライブ解除などのコマンドを解析するために行うようなものです。引用されたテキスト、ヘッダーと本文の区別など、多くのクレイジーなフォーマットと処理するものがあることがわかりました.
これを行うための perl モジュールが理想的ですが、任意の言語でのソリューションを歓迎します。
automation - 自動化に対する保護
私たちの次のプロジェクトの 1 つは、最高のプレイヤーに賞品を贈りたい顧客向けの MS Windows ベースのゲーム (winform GUI と統合された DirectX ディスプレイ コントロールを備えた C# で記述) になる予定です。このプロジェクトは、チャンピオンシップ、はしご、トーナメント、プレイヤー対プレイヤーのアクションなどで、数年間実行することを意図しています。
ここでの主な懸念の 1 つは不正行為です。たとえば、カスタムメイドのボットにゲームをプレイさせることができれば、プレイヤーは劇的な利益を得ることができます (何時間もプレイするというよりも、戦略決定の観点から)。 .
私の質問は、ボットの活動を検出するために必要な技術的な可能性は何ですか? もちろん、プレイ時間数を追跡したり、異常を検出するための戦略を分析したりすることはできますが、この質問に関する限り、次のような詳細を知りたいと思います。
- 別のアプリケーションが定期的なスクリーンショットを作成するかどうかを検出する方法は?
- 別のアプリケーションがプロセスメモリをスキャンしているかどうかを検出する方法は?
- ユーザー入力 (マウスの動き、キーボード入力) が人間によって生成され、自動化されていないかどうかを判断する良い方法は何ですか?
- 別のアプリケーションがアプリケーションのコントロールに関する情報 (コントロールの位置など) を要求しているかどうかを検出することは可能ですか?
- チーターが現在のゲームの状態に関する情報を収集し、それらをボットに送り、決定されたアクションをクライアントに送り返すことができる他の方法はありますか?
あなたのフィードバックは大歓迎です!
search-engine - ボットに特定のプロパティを入力することで特別なカタログを作成するために使用できる、索引付けボットを含む検索エンジンはありますか?
私たちのアプリケーション (C#/.NET) は、検索するために多くのクエリを必要とします。Google の 1 日あたり 50,000 件のポリシーでは不十分です。設定した特定のルール (国のドメインなど) に従ってインターネット Web サイトをクロールし、URL、テキスト、キーワード、Web サイトの名前を収集し、独自の内部カタログを作成して、大規模な外部検索エンジンに制限されないようにするものが必要です。グーグルやヤフーのように。
サーバーにインストールするために使用できる無料のオープン ソース ソリューションはありますか?
車輪を再発明しても意味がありません。
php - ボットが PHP でファイル ダウンロード カウンターをインクリメントするのを止めるにはどうすればよいですか?
ユーザーがリンクをクリックして私の Web サイトでファイルをダウンロードすると、この PHP ファイルに移動し、そのファイルのダウンロード カウンターがインクリメントされ、実際のファイルにヘッダー () リダイレクトされます。ただし、ボットがダウンロード リンクをたどっていると思われるため、ダウンロード数は不正確です。
- リンクをたどってはいけないことをボットに知らせるにはどうすればよいですか?
- ほとんどのボットを検出する方法はありますか?
- ファイルのダウンロード数をカウントするより良い方法はありますか?
apache - User-Agent に基づいて Apache のトラフィックを調整する
Linux で WebSphere 6.0 の前に Apache (IBM HTTP Server 6.0.2.0) を実行しています。さまざまな IP アドレスから特定の User-Agent から過剰なトラフィックが発生しています。User-Agent または IP アドレスをブロックしたくはありませんが、それらを少し遅くしたいと考えています。
私たちにとって最良のシナリオは、すぐに使用できる Apache 構成オプションを使用して問題を解決することです。
ご意見やご提案をいただければ幸いです。
ありがとう!
php - フォーラムに投稿するには、どの $_POST[] が必要ですか?
私はフォーラムの管理者です。以前は phpbb 2.0 があり、フォーラムに書き込むことができるボットを作成しました。現在、フォーラムを phpbb 3.0 にアップグレードしましたが、ボットからフォーラムに書き込むことができなくなりました。
私は解決策を探しましたが、今はアイデアがありません。誰かが提案を持っていれば、それは素晴らしいことです。
このボットを作成するために、CURL と php を使用しました。
ボットの使用法: ユーザーは外部 Web サイトにログインして、オンラインでプレーしたサッカーの試合結果を報告します。その後、ボットは自動的にフォーラムに投稿を書き込みます。
したがって、基本的に、送信する必要がある $_POST[] を知る必要があります。
bots - Java との gtalk コンタクトとして使用するボットの開発
gtalk からチャットできるボットを開発したいと考えており、Java の経験があります。
IA 目的でボットを使用したくありません。
ボットを使用して、xterm のようなコンソールをエミュレートしたいと考えています。
編集:
わかりました:質問は「それを開発する方法についての手がかりはありますか?」です。
オーサーに感謝します。