私はファイルを解析しようとし、タグ内のすべての列の番号を検出する必要があります。私は検出する必要があります:
- 番号がある場合
- 数字が1〜3桁の場合。
- 開始、終了、または分離されたドットに単一のドットがある場合(文字列置換を使用して、ドットの最後の2つの検出を実行できますが、数字の検出はわかりません)。
タグ内のデータを抽出するforループがすでにあります。
for %%Z in (hide_2.htm) do (
for /F "tokens=1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20 delims=<>" %%A on ('grep -B 1411 -E "</table>" %%Z ^| grep -E ^"^(display^|^^\d\d{1,3}^|country^|^<td^>HTTP^|rightborder^).*$^" ') do (
echo A:%%A + %%B + %%C + %%D + %%E + %%F + %%G + %%H + %%I + %%J + %%K + %%L
pause
)
)
入力は次のとおりです。A:+ td + span + span + 41 + / span + span style = "display:none;" + 111
+ / span + div + +
A:style = "display:none;" + 190 + / div + span class = "" style =""+ 。+ / span + span + 197 + / span + span + +
A:style = "display:none;" + 24 + /span+スパン+/span+ 。+ span style = "display:+ + + + +
A:inline;" + 132 + / span + span style = "display:none;" + 39 + /span+ 。+スパン+++ +
A:style = "display:inline;" + 186 + / span + / span + / td + + + + + + +
A:+ td rel = "rw" + span class = "country" + img + + + + + + + +
A:+ td + HTTPS + / td + + + + + + + +
ソースデータはここから取得されます。
編集: 最良の方法は、2つの変数を保持することです。数値を保持するための1番目の変数、およびドットまたはドットが存在する場合はフラグを保持するための2番目の変数。
Edit2: 入力値は次のようになります:120,132,186,24,111,41、。、または.120、.132、.186、.24、.111、.41...値は任意の列に含めることができます。
Edit3: 番号は常に列の最後にあります。また、ドットは最初に置くことができますが、数値変数の結果に含めることはできません。