Google 抽出の結果を見てきましたが、これでは機能しません。コードにアクセスしてパラメーターを変更するだけで、実行時に検索が行われ、役職、場所、日付がスクレイピングされます。これは私がこれまでに持っているものです。どんな助けでも素晴らしいでしょう、そして前もって感謝します。
スクリプトで、指定されたパラメーター (エンジニア ソフトウェア CA) を使用して Monster.com で検索を実行し、結果をスクレイピングします。
#! /usr/bin/python
import re
import requests
from urllib import urlopen
from BeautifulSoup import BeautifulSoup
parameters = ["Software","Engineer","CA"]
base_url = "http://careers.boozallen.com/search?q="
search_string = "+".join(parameters)
final_url = base_url + search_string
a = requests.get(final_url)
raw_string = a.text.strip()
soup = BeautifulSoup( raw_string )
job_urls = soup.findAll(name = 'a', attrs = { 'class': 'jobTitle fnt11_js' })
for job_url in job_urls:
print job_url.text
print
raw_input("Press enter to close: ")
以下では、これが標準的なスクレイプとして機能することを知っています。
handle = urlopen("http://jobsearch.monster.com/search/Engineer_5?q=Software&where=AZ&rad=20&sort=rv.di.dt")
responce = handle.read()
soup = BeautifulSoup( responce )
job_urls = soup.findAll(name = 'a', attrs = { 'class': 'jobTitle fnt11_js' })
for job_url in job_urls:
print job_url.text
print