0

Web サイトから動的テキストを保存して、サーバー上のファイルにダンプすることはできますか? 私が興味を持っている特定のケースは、このページhttp://www.z1035.com/player.phpから曲 のタイトルを保存し、サーバー上のファイルにすべての曲のタイトルを保存することです。これは可能ですか?これを行うにはどのような方法を使用できますか?

4

2 に答える 2

5

あなたが言及しているのは、一般的に「スクレイピング」として知られています。PHPでそれを行う1つの方法に関する記事は次のとおりです。

http://www.developertutorials.com/blog/php/easy-screen-scraping-in-php-simple-html-dom-library-simplehtmldom-398/

于 2009-08-04T22:29:20.173 に答える
0

私の意見では、Python の URLLib ライブラリを使用すると、スクレイピングがかなり簡単になります。

import urllib, re

url = "http://www.z1035.com/player.php"
f = urllib.urlopen(url)
t = f.read()
#  use regular expression here 
m = re.search(t, "some pattern")
print m.group(1)

これにより、外部リソースがローカル ファイルであるかのように読み込まれ、必要に応じて解析できるようになります。

むかしむかし、聞いていたラジオ番組のすべてのトラックリストを保存したいと思っていました。Python を使用してすべてのトラックリストのリストをダウンロードし、プログラムでそれぞれにアクセスして、その内容をファイルに追加しました。これは非常に便利で、おそらく 20 行もかかりました。

于 2009-08-04T23:03:29.167 に答える