問題タブ [urlparse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
spring - Spring RequestMapping 解析機能の再利用
/my/{custom}/url のようないくつかのプロパティがあります
実行時に {custom} を何らかの値に置き換える必要があります
Spring が @PathAttribute マッチングに同様の構文で「@RequestMapping」を使用していることは知っています。
必要なものを達成するためにSpringから再利用できるクラスがあるかどうか疑問に思っています。
python - 「urlparse」を使用して URL が有効かどうかを確認するにはどうすればよいですか?
URL を開いてデータを読み取る前に、その URL が有効かどうかを確認したいと考えています。
パッケージの関数を使用していましurlparse
た:urlparse
ただし、一部の有効な URL が壊れたものとして扱われていることに気付きました。たとえば、次のようになります。
この URL は有効です (ブラウザを使用して開くことができます)。
URL が有効かどうかを確認するより良い方法はありますか?
python - urlparse を使用して特定の文字列を削除しますか?
私はこのURLを持っています:
そして私はそれをに変換したい
私はpython 2.7を使用していることに注意してください。
戻りますが、URLから一部www.domain.com/a/b/c/d,authorised=false.html
を削除する方法がわかりませんauthorised=false
python - 絶対パスに先頭のスラッシュがない場合の urljoin
http://www.gilacountyaz.gov/government/assessor/index.phpのような一部の Web サイトには、絶対パスであるはずの内部リンクがたくさんありますが、先頭のスラッシュはありません。結果でそれらを解析するとurlparse.urljoin
、次のようになります。
これにより、Web クローラーは既にページにアクセスしたことを認識できず、無限ループが発生する可能性があります。Firefox と Chrome は、問題を特定して正しく解決することができます。
Pythonで同じことを行う方法はありますか? 真の相対パスを扱っている可能性があるため、常に先頭のスラッシュが機能しないと仮定することに注意してください。
python - 保存された html ファイルから解析された URL リンクのリストから、タグの URL リンクを解析します。そして、それをすべてcsv出力に保存します
パート 1 からパート 2 にスムーズに移行し、結果をパート 3 に保存するにはどうすればよいですか? これまでのところ、パート 2 に自分で挿入しない限り、スクレイピングされた URL リンクを解析できませんでした。また、最後の URL リンクが他のすべての URL リンクを上書きしたため、出力結果を保存できませんでした。
パート1:
パート2:
パート3
更新 1.アドバイスの後、私はまだこれを取得します: Traceback (most recent call last): File "page.py", line 31, in website = urllib.urlopen(url) File "/System/Library/Frameworks/Python. Framework/Versions/2.7/lib/python2.7/urllib.py"、87 行目、urlopen の return opener.open(url) ファイル "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2. 7/urllib.py"、180 行目、開いている fullurl = unwrap(toBytes(fullurl)) File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py"、1 行目1057、unwrap url = url.strip() AttributeError: 'ParseResult' オブジェクトに属性 'strip' がありません
python - htmlファイルを解析した後、タプルを文字列に変換します
解析結果をテキスト ファイルに保存する必要があります。
しかし、私はこれを取得します: Traceback (most recent call last): File "c.py", line 26, in outfile.write(item + "\n") TypeError: can only concatenate tuple (not "str") to tuple .
タプルを文字列に変換してテキスト ファイルに保存するにはどうすればよいですか? ありがとう。
python - Python urlparse で URL を解析できません
URL を入力として受け取り、それを解析する小さなスクリプトを作成しようとしています。
以下は私のスクリプトです
しかし、このスクリプトを実行すると./myscript http://www.example.com
次のエラーが表示されます。
私はpython/scripting
に慣れていません。どこが間違っていますか?
編集:私が使用しているPythonのバージョンはPython 2.7.5
python - Pythonでurljoinを使用してURLを結合する
Webスクレイピングをしようとしていますが、相対URLとルートURLの結合に問題があります
たとえば、ルート URL は次のとおりです。http://www.jmlr.org/proceedings/papers/v2
相対 URL は次のとおりです。../v2/meila07a/meila07a.pdf
urlparse で urljoin を使用すると、結果が奇妙になります:
http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf
これは有効なリンクではありません。誰でもそれを手伝ってもらえますか?