TinyMCE のカスタマイズされた実装を使用して、ユーザーが投稿できるサイト (フォーラム、コメントなど) があります。彼らの多くは、Word からコピー & ペーストすることを好みます。つまり、彼らの入力には、多くの関連する MS インライン フォーマットが含まれていることがよくあります。
TinyMCE は書式設定の一部で span タグに依存しているため、単に取り除くことは<span whatever>
できません。ユーザーに TinyMCE の「Word から貼り付け」機能を使用するように強制することはできません (また、そうしたくありません)。とにかくうまく機能しているようです)。
これを処理してくれるライブラリ/クラス/関数を知っている人はいますか? 決定的なものは見つかりませんが、それは一般的な問題に違いありません。私は最近、MS 固有のパターンを探す一連のブルート フォース正規表現でうまくいくかもしれないと考えていましたが、必要がない限り、既に利用可能なものを書き直したくありません。
また、カーリー クォート、EM ダッシュなどを修正するとよいでしょう。私は今、これを行う独自のものを持っていますが、それらすべてを支配する 1 つの MS 変換フィルターを見つけたいだけです。