無料版の phpdocx php ライブラリを使用して、docx ファイルを html ファイルに変換することに成功しています。
問題は、出力に次のような行が含まれることが多いことです。
<span style=" font-family:;">This line is</span><span style=" font-family:;">completely b</span><span style=" font-family:;">roken</span><span style=" font-family:;">b</span><span style=" font-family:;">ecause of the random span tags
そしてブラウザで見られるのと同じ:
「この行は、ランダムなスパン タグのために完全に壊れています」
その後、不要なスパンタグを削除し、それぞれの周りにスペースを配置して、html出力をクリーニングするときに修正しようとしました。もちろん、一部のインスタンスを修正するだけで、実際には他の場所で問題が発生します。上記の行では、次の結果になります。
「この行は、ランダムなスパン タグが原因で完全に壊れています。」
現在、span タグが表示されないようにする唯一の方法は、Word で文に関連付けられているスタイルを選択して削除することです。Word の問題をすでに発見できていれば問題ありませんが、実際にはそうではありません。
phpdocx の使用経験はありますか?また、これに対する解決策はありますか?
ありがとう。