私は Mac マシンに限定されていないため、これはhttps://stackoverflow.com/questions/12234084/batch-html-file-processingの複製ではありません。Linuxでこれをやりたかったのです。
とにかく、次のような一連のタグを削除したい:
<div id="p-person" role="function="">
*some text here*
</div>
そして多分それらを
<b>.
正規表現がこの仕事を行うことができたとしても、正規表現はより複雑なケースでは機能しないため、dom を解析するより洗練された方法を学びたいと思います。