3

インターネットの使用状況を保存して分析するスクリプトを作成したいのですが、訪問したページの単純なリストに加えて、すべてのページに「来ている」と「行く」を含めたいので、データを重み付けして表示できます有向グラフ。しかし、私は何を使うべきかわかりません。

ブラウザの外からインターネットを使用するのは初めての試みなので、どのキーワードを探すべきかわかりません。私が遭遇したことのほとんどは非常に複雑で、ネットワーク管理者にしか役に立ちませんが、そのような低レベルのデータは気にしません。必要なのは URL だけです。その上、送信されたデータだけを監視しても、送信するために何をしたかわかりません (推測します)。

この問題は Firefox プラグインの仕事のように思えますが、どうやらデータをディスクに書き込むことは許可されていないようです。

理想的には、クリック可能なリンク、ブックマーク、アドレスの手動入力、複数のタブまたはウィンドウを処理する必要があります。例を挙げましょう。

  • Firefox を開きます。開始ページは google.com です
  • 別のタブで Stackexchange を開く
  • stackoverflow に移動し、質問を検索して参照します
  • Google タブに変更し、lollcats を検索し、最初の結果 (icanhas.cheezburger.com) をクリックして、いくつかのページを読んでください。
  • フェイスブックに行く
  • Google にアクセスし、Firefox を閉じます

これにより、次の結果が生成されます。

  • add_node('グーグル')
  • add_node('stackexchange')
  • add_node('stackoverflow'); add_edge('stackexchange', 'stackoverlow')
  • add_node('チーズバーガー'); add_edge('グーグル', 'チーズバーガー')
  • add_node('フェイスブック'); add_edge('チーズバーガー', 'フェイスブック')
  • add_edge('フェイスブック', 'グーグル')

または、少なくともロードされた順序でページをリストしてから、一意のエントリごとにノードを追加し、ペアを反復処理してエッジを追加できますが、複数のタブを使用した場合、この結果は正しくありません

概要:
Python または Java を使用して、インターネット トラフィック (少なくとも) または Web ブラウザー (できれば?) を監視して、リンクがクリックされるたびに、アドレスが手動で入力されるか、ブックマークが読み込まれるたびに、ターゲットの場所だけでなく発信元 (現在アクティブなタブの URL) が返されます。これが可能であれば、私を正しい方向に微調整してください。

4

0 に答える 0