Python を使用する最初の試みであり、Google で 1 日を過ごした後、私の古い脳はさらに困惑しています。
pycurl を使用して ntlm プロキシを介してログを記録し、ページをスクレイプしてから、beautifulsoup を使用して結果をきれいにしました。
prettify 出力から 3 つの値を抽出し、それらを変数として保存したいと考えています。ページは動的に生成されるため、ページ上の位置は常に変化します。3 つのラベルはページに 1 回だけ表示され、それぞれの値と比較した位置は一定です。
prettify 出力から Value1、Value2、および Value3 を抽出し、それらを変数として保存するにはどうすればよいですか。
これらの 3 つのワンライナーは、私が Python で行う必要があるものです。
grep -A 3 "Label1" prettify.txt | tail -n 1 |awk '{print $1}'
grep "Label2" prettify.txt | awk '{print $3}'
grep -B 4 "Label3" prettify.txt | awk '{print $1}' RS=[ FS=] | テール -n 1
抜粋 1
<b>
<font color="Red">
Label1
</font>
<font color="blue">
Value1
</font>
</b>
<br />
Label2: Value2
<br />
抽出 2
<li>
<font color="green">
[value3]
</font>
<font color="red">
Label3
</font>
</li>