問題タブ [urlparse]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python での URL 解析 - パスの二重スラッシュの正規化
HTML ページで URL (主に HTTP URL) を解析する必要があるアプリに取り組んでいます。入力を制御できず、予想どおり、少し面倒です。
私が頻繁に遭遇する問題の 1 つは、パス部分に二重スラッシュがある URL の解析と結合に関しては、urlparse が非常に厳密である (そしておそらくバグがある?) ことです。たとえば、次のようになります。
期待される結果の代わりにhttp://www.example.com//path
(または正規化された単一のスラッシュを使用するとさらに良い結果になります)、最終的にはhttp://path
.
ところで、私がそのようなコードを実行している理由は、URL からクエリ/フラグメント部分を削除する唯一の方法を見つけたからです。もっといい方法があるのかもしれませんが、見つけられませんでした。
誰かがこれを回避する方法を推奨できますか、または(比較的単純な、私が知っている)正規表現を使用して自分でパスを正規化する必要がありますか?
python - Pythonでパスを分割する
最後の小数点の後にすべてを切り取り、最後に「html」を追加しようとしています
html
現在のコードは「gen.1.ceb」を返します
名前が「gen.1.html」になるようにしたい
python - URL パラメータとは何ですか? (urlparse 結果の位置 #3 の要素)
私はurlparse.urlparse
メソッドのドキュメントを調べましたが、その部分が何であるかについて少し混乱していparameters
ます(より馴染みのある部分と混同しないでくださいquery
。それは、疑問符の後、フラグメント部分の前にあるものです)。
URL の構造に関するウィキペディアのエントリは、それについて何も述べていません。
php - PHPを使用してURLに追加のパスを挿入する方法は?
私がこのURLを持っているとしましょう:
http://example.com/image-title/987654/
「image-title」と「987654」の間の部分に「download」を挿入したいので、次のようになります。
http://example.com/image-title/download/987654/
助けていただければ幸いです!ありがとうございました。
python - PythonでURLからクエリ文字列を取得する最良の方法は?
この URL https://stackoverflow.com/questions/ask?next=1&value=3からクエリ文字列を取得する必要があり、request.METAを使用したくありません。クエリ文字列を取得するには、さらに 2 つの方法があることがわかりました。
urlparse.urlparse (url).query の使用
URL エンコード の使用 urlencode を使用し、request.GET params 辞書をそれに渡し、文字列表現を取得します。
では、どの方法が良いでしょうか?私の同僚は urlencode を好みますが、満足のいく説明を提供していません。彼らは、urlparse が urlencode を内部的に呼び出していると主張していますが、これは urllib モジュールに urlencode が存在するため、私にはわかりません。
python - URL からクエリ部分を解析する
URLからクエリ部分を解析したいのですが、これはこれを行うための私のコードです:
このコードは良さそうに見えますが、「parse_qs」メソッドは「param1」や「param1=」などのクエリ パラメータを失います。標準ライブラリでクエリ部分を解析し、すべてのパラメータを保存できますか?
python - Python urlparse.unparse_qsl?
Python の urlparse では、urlparse を使用して URL を解析し、次に parse_qsl を使用してクエリを解析できます。
クエリ (名前、値) のペアを削除してから、URL を再構築したいと考えています。
urlunparse メソッドはありますが、unparse_qsl メソッドはありません。
qsl リストからクエリを再構築する正しい方法は何ですか?
python - PythonCSV行値ベースのフロー制御
次の構造のCSVを使用しています。
データは私の閲覧履歴のクリーンアップされたダンプです。特定の日に最初の5つの一意のドメインを数えることに興味があります。これが私がこれまでに持っているものです:
d、dt、およびddを使用して、日付と時刻を区切ります。上記の行の例では、dt = 20:03:15、およびdd=2012-09-01です。「if(dt <"090000")and(dt> "060000")」は、午前6時から午前9時の間にアクセスしたWebサイトのカウントにのみ関心があることを示しています。「毎日午前6時より前にアクセスした最初の5つのWebサイトのみを数える」とはどういう意味ですか?特定の日に数百の行があり、行は時系列になっています。
python - Python:文字列が有効なIRIかどうかを確認するには?
IRIをチェックするための標準関数はありますか?明らかに私が使用できる URL をチェックします:
Unicode 文字を含む URL で上記を試しました。
そして私が得るのはyes an url
. これは、有効な IRI のテストに合格したことを意味しますか? 別の方法はありますか?
python - フラスコpythonのURLにパラメータ値を追加する
次のURLのコードがあります:http://localhost/summary/myfile.csv URLを次のようにします:http://localhost/summary?file = myfile.csv
コードはフラスコに書かれます。
最初のURLの私のコードは次のとおりです。