スタイル付きテキストを MS Word からオンライン テキスト エディタにコピー アンド ペーストします。JavaScript を使用clipboardData.getData("text/html")
して htmlstring を取得すると、テキストが既に HTML/CSS スタイルに変換されていることがわかります。たとえば、インデントは に変換されtext-indent="10dp"
ます。に"\t"
置き換えられ" "
ます。テキスト内のすべての制御文字をキーにする方法はありますか?
また、CRLFがどこから来たのかわかりませんか?
HTML文字列から
THE BOAT did not sail until late afternoon, but so eager was **CRLF**
Robert Townsend to get home that he thought, had there been a day as long as **CRLF**
this.
オリジナル
THE BOAT did not sail until late afternoon, but so eager was Robert Townsend to get home that he thought, had there been a day as long as this.
編集
申し訳ありませんが、以前は私の質問が十分に明確ではなかったかもしれません。HTML 文字列を doc.body.textContent||doc.body.innerText で削除すると、結果文字列に CRLF が含まれているため、これらのスタイル マーカーを削除する方法を教えてください。clipboardData.getData("text") のようなものはどれですか?