問題タブ [url-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1188 参照

javascript - パラメータが特定の順序ではない場合、パラメータ値の変更を含むJavascriptリロードページ

パラメータ値を更新した後、ページの場所をリロードする必要があります。パラメータが常に特定の順序である場合は難しくありませんが、そうではありません。

したがって、設定されたパターンがあれば、正規表現一致を介してそれらをターゲットにすることができます。たとえば、URL の場合: http://www.example.html?sf_id=15040&15041.survey=form&variation=25002_1

私は次のようにそれをターゲットにしていました:

しかし、現在、param の出現はランダムであるため、これらはすべて有効な URL です。

if/else if ステートメントをまだ正しくできることはわかっていますが、特定のパターンがないため、それが正しい方法だとは思いません。

どんな助けでも大歓迎です!ありがとうございました。

0 投票する
2 に答える
1365 参照

python - 絶対パスに先頭のスラッシュがない場合の urljoin

http://www.gilacountyaz.gov/government/assessor/index.phpのような一部の Web サイトには、絶対パスであるはずの内部リンクがたくさんありますが、先頭のスラッシュはありません。結果でそれらを解析するとurlparse.urljoin、次のようになります。

これにより、Web クローラーは既にページにアクセスしたことを認識できず、無限ループが発生する可能性があります。Firefox と Chrome は、問題を特定して正しく解決することができます。

Pythonで同じことを行う方法はありますか? 真の相対パスを扱っている可能性があるため、常に先頭のスラッシュが機能しないと仮定することに注意してください。

0 投票する
2 に答える
1507 参照

python - Python: 末尾のスラッシュを追加する際の URL 解析の問題

URLを正規化するためにPythonで小さな実験を開発していました。/私の主な目的は、URL の末尾にスラッシュがまだ存在しない場合に追加することです。たとえば、そうである場合は、次のhttp://www.example.comように変換する必要がありますhttp://www.example.com/

これは同じための小さなスニペットです:

ただし、これはファイル名も変換します。たとえばhttp://www.example.com/image.pnghttp://www.example.com/image.png/どちらが間違っていますか。ファイル名ではなく、ディレクトリにスラッシュを追加したいだけです。どうすればいいですか?

前もって感謝します!

0 投票する
1 に答える
1080 参照

jmeter - Jmeterを介してURLで使用されるトークンをデコードする方法は?

15 分間の定常負荷で 50 人のユーザーの負荷テストを実行すると、サンプルは次のループに進みません。つまり、50 ユーザーの負荷をかけた場合、最初の 50 サンプルのサンプル テーブルにはエラーが発生しますが、その後のすべてのリクエストは失敗します。

ログアウト時に認証トークンを受け取ります BDT3-CHE8-GKA5-BWA1%7Cd67830e7c46bc1011d76e69de76c59c57c4f5956%7Clin 。前のリクエストでは、前のトークンの BDT3-CHE8-GKA5-BWA1|d67830e7c46bc1011d76e69de76c59c57c4f5956|lin パイプ ( |) 文字が に置き換えられていることがわかります%7C

また、セッション ID は URL 起動ページで生成されるだけですが、Jmeter パラメータには取り込まれず、以降のリクエストでは使用されません。

次のリクエストに渡すことができるように、この問題に関するより多くの洞察、またはトークンをデコードする方法に関する可能な解決策を提供してください。

ログアウト ページの例外:

0 投票する
1 に答える
192 参照

python - Python urllib2 リダイレクトの問題

AWS インスタンスで簡単なスクリプトを実行しようとしています。同じスクリプトが Windows 7 と ubuntu ( python27 ) でうまく動作します。しかし、サーバーでスクリプトを実行すると、Web サイトがエラー ページにリダイレクトされ、「ブラウザで js を有効にする必要があります」と表示されます。

私は今まで多くのことを試してきました (ユーザーエージェント、リダイレクトハンドラー、機械化 ext)。以下のドメインでのみこれらのリダイレクトを取得しています。他のすべての js 対応 Web サイトは正常に機能します。

何か考えはありますか?

編集: Web ページがサーバー IP をブロックしていることが判明しました。手伝ってくれてありがとう

0 投票する
2 に答える
1888 参照

javascript - URL パス セグメント (マトリックス) パラメータを解析するための JavaScript ライブラリは存在しますか?

次の URL を指定します。

車のパス セグメントのマトリックス パラメーター (色とメイク) を取得するために使用できる JavaScript (ノード) ライブラリが必要です。たとえば、次のようになります。

譲るだろう

また、理想的には、そのようなライブラリは、パス セグメント パラメータの適切なデコードを考慮する必要があります。これは、クエリ パラメータと同じデコードではありません。

これらのパラメーター (および URL に関するその他の有用な情報) については、次の記事で詳しく説明します。

https://www.talisman.org/~erlkonig/misc/lunatech%5Ewhat-every-webdev-must-know-about-url-encoding/

私はたくさんのグーグルをしましたが、空になりましたが、うまくいけば私は盲目です!

0 投票する
3 に答える
40 参照

javascript - URL パターン マッチングの問題、.+ はすべての後に一致します

保存されている URL を現在の URL と照合していますが、少し問題があります。URL 自体と照合すると正規表現は正常に機能しますが、何らかの理由ですべてのサブディレクトリも一致します (コース)。

ユーザー store と言うと、これは と の両方にwww.facebook.com一致する必要があります。http://www.facebook.comhttps://www.facebook.com

https://www.facebook.com/events/upcoming問題は、などのサブディレクトリも一致していることです。

たとえば、正規表現:

以下に一致します。

一致する必要がある場合

この一見壊れた正規表現を修正するにはどうすればよいですか?

0 投票する
2 に答える
110 参照

python - Python による URL の解析

解析する必要があります

http://www.webpagetest.org/breakdown.php?test=150325_34_0f581da87c16d5aac4ecb7cd07cda921&run=2&cached=0

上記のURLのソースを表示すると、

期待される出力:

0 投票する
4 に答える
499 参照

php - PHP - メッセージから http/www を削除して (ホスト ドメインを除く)、クリック可能なリンクを無効にします

たとえば、mywebsite.com というシンプルなメッセージ ボードがあり、ユーザーはメッセージを投稿できます。現在、ボードはすべてのリンクをクリック可能にしています。誰かが次で始まる何かを投稿したとき:

次に、スクリプトはそれらを自動的にリンクとして作成します (つまり、A href.. タグを追加します)。

問題 - スパムが多すぎます。したがって、私の考えは、上記の http|s/www を自動的に削除して、これらが「クリック可能なリンク」にならないようにすることです。ただし、ポスターが自分のサイト内のページにリンクできるようにしたいと考えています。メッセージに mywebsite.com へのリンクが含まれている場合は、http|s/www を削除しないでください。

私のアイデアは、2 つの配列を作成することでした。

しかし、それらを正しく使用する方法がわかりません (おそらく str_replace が何らかの形で機能する可能性があります)。

以下は、投稿前と投稿後の $message の例です。

$message 前:

こんにちは、 http://mywebsite/aboutのおかげで、多くのことを学びました。http://www.bing.comhttps://google.com/search、および一部のwww.spamwebsite.com/refid=spammer2であなたを見つけました。

$message AFTER:

こんにちは、 http://mywebsite.com/aboutのおかげで、多くのことを学びました。bing.com、google.com/search、およびいくつかの spamwebsite.com/refid=spammer2 であなたを見つけました。


ユーザーが投稿フォームにクリア テキストを入力することに注意してください。したがって、スクリプトはこのクリア テキストでのみ機能する必要があります (href などではありません)。