私は、HTTP トラフィック ラインでファイルを解析し、ドメインを取り出して、現在、それらを画面に出力するだけのスクリプトを書いています。httpry を使用して、トラフィックを継続的にファイルに書き込みます。ドメイン名を削除するために使用しているスクリプトは次のとおりです
#!/usr/bin/python
import re
input = open("results.txt","r")
for line in input:
domain = line.split()[6]
if domain != "-":
print domain
このスクリプトはうまく機能しますが、このスクリプトを継続的に実行して、新しいトラフィックが入力ファイルに追加されたときに、スクリプトがそれを取り除くことができるようにしたいと考えています。最終的にはこれらのドメインを Mongo データベースに入力することになるため、httpry の出力に対して awk を実行することはできません。そのためのスクリプトも必要になります。出力でこの python スクリプトを常に実行するが、以前のエントリを再表示しない方法を誰かが教えてくれれば、大歓迎です。ありがとう。