問題タブ [bots]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
1557 参照

perl - Perl Jabber ボットをイベント駆動型プログラムにするにはどうすればよいですか?

Jabber ボットを作成しようとしていますが、メッセージを待っている間、それを実行し続けることができません。スクリプトを継続的に実行するにはどうすればよいですか? 理論的には、メッセージをチェックしてそれに応じて反応するように設定した while ループを持つサブルーチンを呼び出してみましたが、スクリプトはそのように動作しません。

これが私のソースです:http://pastebin.com/03Habbvh

0 投票する
1 に答える
1516 参照

gmail - Gmailチャットボットを構築する方法は?

私は同様の質問を読みましたが、彼らはAIモデルについて話します。私がやりたいのは、事前定義されたコマンドを受け入れ、必要なアクションを実行する単純なボットを構築することです。学習は必要ありません。フローチャート全体を用意しました。必要なのは、ユーザーがチャットで入力するコマンドを取得することです。

0 投票する
1 に答える
702 参照

indexing - Yahoo Indexing Botが「悪」と見なされるのはなぜですか?

この質問を読んでコメントした後、GoogleやBingなどでサイトインデックスを維持するためのPHPライブラリを読んだ後、StackOverFlowのサイトマップを見てみたいと思いました。これは404エラーを返しました。これは、あなたがインデックスボットであるか、単に存在しないかを判断することにより、保護されたページにすぎないと推測しています。

次に、StackOverFlowのrobots.txtを確認します。「Yahooボットは悪だ」というコメントと、他の2つのインデックスボット(Spinn3rとKSCrawler)を見て驚いた。私はSpinn3rとKSCrawlerに慣れていませんが、私の質問は、なぜこれらのボット(特にYahoo)が悪と見なされるのかということです。確かに、検索エンジンのすべてのインデックス作成は良いことですか?

0 投票する
2 に答える
835 参照

ruby-on-rails - Railsは保護に関する質問、隠しフィールドを形成します

ライブレールのウェブサイトを持っていて、たくさんのフィールドが入ったフォームが欲しいです。検証を設定し、すべてのフィールドのフォーマットを許可しました。私はそれをかなりテストしました、そしてそれは私がそれに投げたものを何でも捕らえるようです。ほぼ稼働の準備ができていると思いますが、それを保護するために他にやるべきことがあるかどうかを4倍に確認したいと思います。私のサイトは訪問者数が少ないですが、できるだけ安全にしたいと思っています。可能であれば、キャプチャの使用は避けたいと思います。隠しフィールドを使用してフォームをボットから保護できることを読みました。キャプチャを使用する代わりに、またはキャプチャと一緒に使用する代わりに、これをお勧めしますか?

私のフォームは本当に標準です:

提案やコードサンプルをいただければ幸いです。

0 投票する
2 に答える
1201 参照

python - Appengine Apps 対 Google ボット Web クローラー

appengine Web アプリ cricket.hover.in を作成しました。Web アプリには約 15,000 の URL がリンクされていますが、長い間立ち上げても Google にインデックスされたページはありません。

私のルート サイト hover.in に配置されたベース リンクは、数分でインデックス化されています。しかし、ルートサイトの同じリンクのホームページをずっと前に配置しました。しかし、それは役に立たない。

cricket.hover.in に問題があるかどうか、またはボットに Google アプリ エンジンに問題があるかどうか、誰でも分析できますか

Google のウェブマスター ツールのラボ アプリを使用して実際に URL をテストしたところ、戻り値は問題なく、html は明確です。

しかし、次の URL で同じ (cricket.hover.in) をテストすると、異なる失敗の結果が表示されます

www.dnsqueries.com/en/googlebot_simulator.php

www.smart-it-consulting.com/internet/google/googlebot-spoofer/

しかし、上記の URL で私の php またはワードプレスのリンクのいくつかをテストすると、結果は良好で問題ありません。


質問の間違いで申し訳ありませんが、誤解を招いてすみません。ドメインは cricket.trak.in/ で、ベース URL の trak.in から参照されます。長い調査の後、問題の解決策を見つけられなかったという半分の間違いを犯しました。このドメインで確認してください。

提出されたサイト マップは 3 日前に提出され、合計でほぼ 22,000 の uri が提出されましたが、現在までにインデックス化されたカウントはまだ 0 です。

第二に、cricket.trak.in 自体は 15,000 uri を返しません。つまり、クロールされた場合、サイト全体で約 15,000 uri が返されます。

0 投票する
2 に答える
733 参照

php - メールを受け入れるphpスクリプト(メールボットなど)を作成することは可能ですか?

電子メールを受信し、その電子メールの指示に応じて何かを実行できるスクリプトを作成したいのですが、どこから始めればよいのかわかりません。これはPHPで可能ですか?

0 投票する
1 に答える
974 参照

asp.net-mvc - ASP.NET の悪意のあるクローラー ブロッカー

Bad Behaviorに出くわしました。PHPのプラグインで、スパムや悪意のあるクローラーがサイトにまったくアクセスできないようにして検出することを約束しています。

ASP.NET と ASP.NET MVC に似たようなものはありますか?

サイトへのアクセスを完全にブロックすることに関心がありますが、投稿後にスパムを検出することには関心がありません。

編集: サイトへのアクセス パターンを検出するソリューションに特に興味があります。これらのソリューションは、サイト全体のスクリーン スクレイピングを防止するか、少なくとも犯罪者にとって非常に遅いプロセスになります。クリックの頻度とクリックに見られるパターン (深さ優先で 100 個のリンクを訪問した場合、誰かがサイトをクロールしていることは明らかです)。

悪意のあるクローラーとは、主に他のサイトの複製コピーを作成しているボットを意味しますが、サイトで送信可能なフォームを見つけてがらくたを送信しようとするスパムボットも意味します。

0 投票する
1 に答える
2938 参照

apache - htaccessApacheを使用してすべてのボットをリダイレクトします

既知のボット、たとえば大きなボットを検出するために、どの.htaccessリライターを使用する必要がありますか。

altavista、google、bing、yahoo

私は彼らのIPまたはホストをチェックできることを知っていますが、より良い方法はありますか?

0 投票する
1 に答える
368 参照

java - Java シャウトキャスト クエリ

シャウトキャスト サーバーにクエリを実行し、基本的な情報 (曲の再生など) を返したい Java IRC ボットがあります。誰かが私を正しい方向に導くことができますか? ありがとうございました。

0 投票する
2 に答える
543 参照

asp.net - 検索エンジンがユーザー名をクロールできるようにする

ユーザーが自分のプロファイルを入力し、特定の詳細をパスワードで保護できるサイトがあります。プロファイルの「保護されていない」部分(ユーザーごとに異なります)を検索エンジンでクロールしたいと思います。Facebookにユーザーの名前を入力した場合と同様に、ユーザーのFacebookプロファイルが検索結果に表示されます。ボットがパスワードで保護されたセクションをクロールしないようにするために特別なことをする必要がありますが、それでも(常に公開されている)ユーザー名をクロールしますか?これが問題であるかどうかはわかりませんが、robots.txtを更新してこれを可能にしたいと思います。

また、ボットがユーザー名を(安全に)利用できるようにするにはどうすればよいですか?名前のリストを使用して別のディレクトリを作成する必要がありますか、それともより良い方法がありますか?

アドバイスありがとうございます