今、私はこのような問題に直面しています:
たとえば、URLのリストがあるとします。
['http://example.com/1',
'http://example.com/2',
'http://example.com/3',
'http://example.com/4',
...,
'http://example.com/100']
そして、それらのいくつかは利用できないURLであり、それらのURLを要求すると、302リダイレクトステータスコードになります。例:... / 1-... / 50は利用可能なURLですが、... / 51は302を引き起こします。次に、.../50が必要なURLです。
どのURLが最後に利用可能なURL(302コードを返さない)であるかを知りたいのですが、バイナリ検索でうまくいくと思いますが、より効率的に実装するにはどうすればよいでしょうか。私はPythonのurllib2を使用して302ステータスコードを検出します。
pseg ... / 1-... / 50は利用可能なURLですが、... / 51は302を引き起こします。次に、.../50が必要なURLです。