編集したいhtmlファイルを読み取るスクリプトがあります。ここに、:remove_redundant_columnsサブルーチンを呼び出すコードを貼り付けます。
各行の先頭からスペース/空白を削除し、htmlファイルから削除する必要があります。唯一の問題は、ほとんど空の行に=のような余分なテキストが追加され、タブがほとんどないことです。
ダウンロードしたhtmlファイルはhidemyass.com/proxy-list/1からです
call parse_proxy.bat remove_redundant_columns !FILENAME!
exit /b
:remove_redundant_columns
REM Remove whitespaces from begin of lines and <span></span>
FOR /f "tokens=*" %%t in (%1) do (
SET S=%%t
SET S=!S:^<span^>^</span^>=!
if NOT "!S!"=="" >>$tmp$ echo !S!
)
del %1
REN $tmp$ %1
exit /b