任意の HTML ファイル (ブログ投稿など) のプレーン テキスト表現が必要です。HTML から txt へのコンバーターは数多くあります。ただし、段落内のテキスト (「p
要素」と読む) は、プレーン テキスト ビューで (一定の列数まで) 両端揃えにする必要があり、可能であれば、より読みやすい結果を得るためにハイフンを使用する必要があります。また、結果のテキスト ファイルは UTF-8 または UTF-16 である必要があります。
XSLT を使用して実行できる単純なプレーン テキストの会話は、ほとんど些細なことです。しかし、テキストの正当化はその可能性を超えています (XSLT はチューリング完全ですが、現実に十分近いため、完全には当てはまりません)。
FOPと XSL-FO も機能しません。要求どおりに動作しますが、FOP のプレーン テキスト出力はひどいものです (開発者は、そのような使用を意図していないと述べています)。
HTML -> XSLT -> Roff も試してみましたが、groff に行き詰まっており、その Unicode サポートは最適とはほど遠いものです。省略記号 ("...") のような文字や印刷上正しい引用符があるため、XSLT スタイルシートで groff に何十もの Unicode 文字のエスケープ シーケンスを伝えるのは非常に面倒です。
別の方法として、TeX に変換してプレーン テキストとして出力することもできますが、(La)TeX でこれを試したことはありません。
おそらく、本当に単純なことを見逃しているのでしょう。どうすれば上記を達成できるのでしょうか?ところで、解決策は、PHP、Python、Perl、XSLT、またはまともな Linux ディストリビューションにあるプログラムを使用して、root 権限なしでインストールできることが望ましいです。