解析中の HTML ドキュメントには、いくつかの ASCII 制御コードが含まれています。PHP の DOMDocument パーサーは、ノード内で ASCII 制御文字を検出すると、テキスト ノードを切り捨てることに気付きました。
Device Control 0x13
End of Medium 0x19
File Separator 0x1C
Group Separator 0x1D
これはバグですか、それとも機能ですか? DOMDocument を別の方法で動作させる方法はありますか? DOM 処理の前にこの文字を削除することにしましたが、それが正しい解決策であるかどうか疑問に思います。