私はmhtファイルを持っています。mhtのすべてのテキストを取得したいと思います。正規表現を使用することを考えましたが、英語以外の言語がmhtにあるため、テキスト自体にA7 = A98 =D6...のようなものが含まれています。
ブラウザで表示されているファイルのすべてのテキストを選択し、それをコピーしてメモ帳に貼り付けます。これが私が必要としているものです。
ありがとう。
Internet Explorerでファイルを開き、プレーンテキスト(UTF-8)として保存します。:)自動化されたソリューションが必要な場合は、プラットフォームまたはプログラミング言語用のmhtからtxtへのコンバーターを探してください。
実際、これはPowershellでも自動化できます。
$ie = New-Object -ComObject "InternetExplorer.Application"
$ie.Navigate2("file:///C:/MyFile.mht")
$text = $ie.Document.documentElement.innerText