私がやろうとしているのは、Python で特定のページを見つけることです。つまり、次のようになります。たとえば、存在する場合は出力され、存在しない場合は出力されません。私はそれを知っていますが、問題は、ウェブサイトのページを見つける機能は何ですか? お気に入り。/test/ を見つけたいのですが、存在しない場合は、「/test/ は Web サイト: test.com に存在しません」と表示されます。
私は何をしなければなりませんか?
私がやろうとしているのは、Python で特定のページを見つけることです。つまり、次のようになります。たとえば、存在する場合は出力され、存在しない場合は出力されません。私はそれを知っていますが、問題は、ウェブサイトのページを見つける機能は何ですか? お気に入り。/test/ を見つけたいのですが、存在しない場合は、「/test/ は Web サイト: test.com に存在しません」と表示されます。
私は何をしなければなりませんか?
ページのHTTP ステータス コードを確認するだけです。リクエストの使用例:
>>> import requests
>>> response = requests.get('http://google.com/test')
>>> response.status_code
404
>>> if response.status_code == 404:
... print "/test/ does not exist on the website: google.com"
...
/test/ does not exist on the website: google.com
のようなライブラリを使用している場合は、requests
単に URL を試すことができます。404 が返された場合、そのページは存在しません。
例えば
r = requests.get('http://test.com/test')
if r.status_code == 404:
print "/test/ does not exist on the website: test.com"
組み込みの urllib モジュールを使用することもできます
from urllib import urlopen
response = urlopen('http://stackoverflow.com/questions/17993222/how-do-i-find-a-page-in-python')
if response.getcode() == 200:
print("page exists")
elif response.getcode() == 404:
print("page does not exist")