DVIファイルを取得してtexに変換する方法はありますか?
7 に答える
これは、PDFをXMLに変換する問題に似ています。これは、「ハンバーガーを牛に戻そうとする」と呼ばれます。TeX->DVIとXML->PDFはどちらも、ドキュメントの構造とそのセマンティクスの両方で情報を失います。
元のドキュメント(の一部)を再作成するには、大量のヒューリスティックと大規模なコーパスが必要です。通常100%になることはありません。テキスト文字列は可能かもしれません、ベクトルはより難しいです。ビットマップはほとんど不可能です。
あなたが求めていることは不可能です。(PostScript の場合と同様に) DVI ファイル内の単語を認識することでさえ、ヒューリスティックが必要になる場合があると思います。DVI ファイルは、紙のどこに個々の文字を配置するかを記述したものであり、それ以上のものではありません。
dvi2tty
、または を実行したdvips
後にを実行することで、途中まで到達することができますps2ascii
。どちらでも最良の結果が得られます。
この質問をもう一度見つけた人、または答えてくれたすべての人にとって、私にとって最良の答えを見つけました。 (または、DVIをpdfに簡単に変換できるので、pdf)。InftyReader がそれを行います。それは完全に機能します。私はそれにたくさんのpdfを試してから、それらをpdfに作り直しましたが、完璧でした!
これは不可能だと確信しています。DVI には、ページのレンダリングに関する情報が含まれており、どの tex コマンドが含まれているかは含まれていません。
ええと、まあ、ちょっと。
抵抗が最も少ない方法は、dvi->rtf コンバーターを使用することだと思います。Q#1859373 dvi2rtf: who can convert DVI files to RTFという質問を投稿しました。そして、テストされていない実装を投稿します。これは、すべての書式設定を破棄する悪い解決策を提供します。
そのようなことで、word2007/8 と優れた docx2tex ユーティリティを使用して、rtf を tex に変換できます。
結果は読むのが不快ですが、そのようなことを行うためのいくつかのユースケースを見ることができます.
DVI ファイル形式の説明を読み、プログラムを書き込みます。プログラムの結果は元のテキストにはなりませんが、適切です。