問題タブ [urlparse]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
466 参照

spring - Spring RequestMapping 解析機能の再利用

/my/{custom}/url のようないくつかのプロパティがあります

実行時に {custom} を何らかの値に置き換える必要があります

Spring が @PathAttribute マッチングに同様の構文で「@RequestMapping」を使用していることは知っています。

必要なものを達成するためにSpringから再利用できるクラスがあるかどうか疑問に思っています。

0 投票する
4 に答える
26205 参照

python - 「urlparse」を使用して URL が有効かどうかを確認するにはどうすればよいですか?

URL を開いてデータを読み取る前に、その URL が有効かどうかを確認したいと考えています。

パッケージの関数を使用していましurlparseた:urlparse

ただし、一部の有効な URL が壊れたものとして扱われていることに気付きました。たとえば、次のようになります。

この URL は有効です (ブラウザを使用して開くことができます)。

URL が有効かどうかを確認するより良い方法はありますか?

0 投票する
1 に答える
46 参照

python - urlparse を使用して特定の文字列を削除しますか?

私はこのURLを持っています:

そして私はそれをに変換したい

私はpython 2.7を使用していることに注意してください。

戻りますが、URLから一部www.domain.com/a/b/c/d,authorised=false.htmlを削除する方法がわかりませんauthorised=false

0 投票する
2 に答える
1365 参照

python - 絶対パスに先頭のスラッシュがない場合の urljoin

http://www.gilacountyaz.gov/government/assessor/index.phpのような一部の Web サイトには、絶対パスであるはずの内部リンクがたくさんありますが、先頭のスラッシュはありません。結果でそれらを解析するとurlparse.urljoin、次のようになります。

これにより、Web クローラーは既にページにアクセスしたことを認識できず、無限ループが発生する可能性があります。Firefox と Chrome は、問題を特定して正しく解決することができます。

Pythonで同じことを行う方法はありますか? 真の相対パスを扱っている可能性があるため、常に先頭のスラッシュが機能しないと仮定することに注意してください。

0 投票する
1 に答える
1113 参照

python - 保存された html ファイルから解析された URL リンクのリストから、タグの URL リンクを解析します。そして、それをすべてcsv出力に保存します

パート 1 からパート 2 にスムーズに移行し、結果をパート 3 に保存するにはどうすればよいですか? これまでのところ、パート 2 に自分で挿入しない限り、スクレイピングされた URL リンクを解析できませんでした。また、最後の URL リンクが他のすべての URL リンクを上書きしたため、出力結果を保存できませんでした。

パート1:

パート2:

パート3

更新 1.アドバイスの後、私はまだこれを取得します: Traceback (most recent call last): File "page.py", line 31, in website = urllib.urlopen(url) File "/System/Library/Frameworks/Python. Framework/Versions/2.7/lib/python2.7/urllib.py"、87 行目、urlopen の return opener.open(url) ファイル "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2. 7/urllib.py"、180 行目、開いている fullurl = unwrap(toBytes(fullurl)) File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib.py"、1 行目1057、unwrap url = url.strip() AttributeError: 'ParseResult' オブジェクトに属性 'strip' がありません

0 投票する
1 に答える
471 参照

python - htmlファイルを解析した後、タプルを文字列に変換します

解析結果をテキスト ファイルに保存する必要があります。

しかし、私はこれを取得します: Traceback (most recent call last): File "c.py", line 26, in outfile.write(item + "\n") TypeError: can only concatenate tuple (not "str") to tuple .

タプルを文字列に変換してテキスト ファイルに保存するにはどうすればよいですか? ありがとう。

0 投票する
2 に答える
1889 参照

python - Python urlparse で URL を解析できません

URL を入力として受け取り、それを解析する小さなスクリプトを作成しようとしています。

以下は私のスクリプトです

しかし、このスクリプトを実行すると./myscript http://www.example.com

次のエラーが表示されます。

私はpython/scriptingに慣れていません。どこが間違っていますか?

編集:私が使用しているPythonのバージョンはPython 2.7.5

0 投票する
1 に答える
396 参照

python - Pythonでurljoinを使用してURLを結合する

Webスクレイピングをしようとしていますが、相対URLとルートURLの結合に問題があります

たとえば、ルート URL は次のとおりです。http://www.jmlr.org/proceedings/papers/v2

相対 URL は次のとおりです。../v2/meila07a/meila07a.pdf

urlparse で urljoin を使用すると、結果が奇妙になります:

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

これは有効なリンクではありません。誰でもそれを手伝ってもらえますか?