71

シナリオ:
LaTeX(この場合は履歴書)を使用して作成したドキュメントがあります。これはpdflatex正しくコンパイルされ、希望どおりに出力されます。今、私は同じドキュメントをプレーンな古いASCIIに変換する必要があります。

例:
これが(少なくとも1回は)ここで行われているのを見ました。作成者は、PDFバージョンと、マージン、間隔、箇条書きなど、ほぼすべての点でPDFバージョンと一致するASCIIバージョンを持っています。

このタイプの変換はASCII形式の制限のために正確ではないことを認識していますが、これまでに見つけたものに基づいて、非常に近い近似が可能であるように思われます。これを行うためのプロセスは何ですか?

4

14 に答える 14

44

Opendetexは、Windows と Linux の両方で利用できます (Mac でも問題なくコンパイルされます)。https://github.com/pkubowicz/opendetexからダウンロードできます。

使用法:

detex project

project.tex を開き、\include または \includeonly コマンドを使用してインクルードされたすべてのファイルを読み取り、結果のテキストを標準出力に出力します。

detex -n project > out.txt

project.tex を開き、\include または \includeonly コマンドに従わず、結果のテキストを out.txt に出力します

detex --help

完全なヘルプを表示します

選択した任意のディレクトリに展開します。ダウンロード ディレクトリに展開したとします。

その中に任意の名前の別のディレクトリを作成します (これはオプションですが、推奨されます)。ディレクトリ名を「my_paper」としましょう。論文を「my_paper」ディレクトリに置きます。論文の名前が project.tex であるとします。

パスに移動

    cd ~/Downloads/opendetex

コマンドを実行します

    detex my_paper/project.tex  > out.txt

総称形

    detex -n full_path_to_tex_file.tex > output_text_file.txt
于 2013-01-14T14:25:40.707 に答える
17

CatDVIは、DVI をテキストに変換し、フォーマットを維持しようとします。

于 2009-02-09T21:45:18.440 に答える
14

ここで提案されているプログラムのいくつかを試すことができます。

TeX から ASCII

于 2009-02-09T21:45:57.627 に答える
9

You can also try Pandoc, it can transform latex to many other formats. I suggest reading its documentation, for there may be some tricky cases that you need pass some arguments to handle.

于 2013-04-27T01:22:04.663 に答える
9

pdftotext はレイアウトを保持できます

を使用している場合、DVI を生成するためpdflatexに切り替えるパッケージ オプションをいじりたくないでしょう。latex

代わりに、pdf ファイルを取得して変換します。これは、Curve パッケージで作成された私の履歴書/履歴書で機能しました。

pdftotext  -layout MyResume.pdf

-layoutフラグに注意してください。

于 2015-03-09T13:41:48.490 に答える
3

こちらの手順をお試しください:http: //zanedp.livejournal.com/201222.html

LaTeXファイルをプレーンテキストに変換するシーケンスは次のとおりです。

$ latex file.tex
$ catdvi -e 1 -U file.dvi | sed -re "s/\[U\+2022\]/*/g" | sed -re "s/([^^[:space:]])\s+/\1 /g" > file.txt

catdviの-e1オプションは、ASCIIを出力するように指示します。1ではなく0を使用すると、Unicodeが出力されます。Unicodeには、箇条書き、emdash、ギリシャ文字などのすべての特殊文字が含まれます。また、「fi」や「fl」などの一部の文字の組み合わせの合字も含まれます。あなたはそれが好きではないかもしれません。したがって、代わりに-e1を使用してください。-Uオプションを使用して、不明な文字のUnicode値を出力するように指示します。これにより、文字を簡単に見つけて置き換えることができます。

コマンドの2番目の部分は、箇条書き文字(•)を指定するために使用される文字列[U + 2022]を検索し、それらをアスタリスク(*)に置き換えます。

3番目の部分は、行頭(インデント)のスペースを保持しながら、テキストを完全に揃えるためにcatdviが投入した余分な空白をすべて使い果たします。

これらのコマンドを実行した後、.txtファイルで文字列[U +を検索して、ASCIIにマップできないUnicode文字が残っていないことを確認して修正することをお勧めします。

于 2010-01-20T19:24:33.137 に答える
3

私の通常の戦略は、hyperlatexを使用して Web ページに変換し、Web ブラウザーからコピーして貼り付けることです。これが最良のフォーマットを提供することがわかりました。

私は通常、いくつかの行折り返しを手動で修正する必要があります...

于 2009-02-09T21:55:20.833 に答える
3

私に最適な解決策は次のとおりです。ラテックス ドキュメント名 (拡張子なし) が保存されていると仮定すると、${BASENAME}次の 3 つの手順を適用します。

htlatex ${BASENAME}.tex

iconv -f iso-8859-1 -t utf-8 ${BASENAME}.html > ${BASENAME}-utf8.html

html2markdown ${BASENAME}-utf8.html > ${BASENAME}.txt

どうやら、持っtex4htpython-html2textインストールする必要があります。

于 2012-10-29T16:46:53.370 に答える
3

インデックス作成と検索のために TEX ファイルからプレーン テキストを取得する必要があったとき、LaTeX2RTF が優れたソリューションであることがわかりました。LaTeX2RTF にはWindows 用のインストーラと GUI があり、開くことができる 50 ページの論文の RTF ファイルが生成されました。ワードで。

于 2012-02-12T16:08:34.557 に答える
2

私はLyXを試しましたが、かなりうまくいきました。唯一のニュアンスは、他の TeX ファイルを含む TeX ファイルがある場合、何か不足していない限り、それらをすべて個別にエクスポートする必要があるということです。

于 2011-07-11T02:28:28.720 に答える
1

Pandocを使用すると、ファイルをある形式から別の形式に変換できます。次の pandoc コマンドを使用します。

pandoc -s /path/to/foobar.tex -o foobar.txt

行を特定の列で改行したい場合は、--columnフラグを使用します。--columns 10000切れ目のないラインに使用します。

マークダウン(.md) などの他の多くの形式に-o foobar.txt変換できます。 を指定しない場合、pandoc は任意のオンライン ツールでレンダリングできる html を出力します。-o foobar.txt

pandoc をインストールするには、この公式ドキュメントに従ってください

于 2017-10-31T06:22:34.030 に答える
0

lyx にインポートして、lyx のテキストへのエクスポート機能を使用できます。

lyx を使用しない場合はばかげていますが、既に使用している場合は、非常に迅速かつ簡単な解決策です。公平を期すために、私のファイルは非常に単純ですが、私にとっては良い結果です。より複雑なファイルがどのように変換されるかはわかりません。

于 2009-11-01T19:09:25.133 に答える
0

Emacsにはコマンドがiso-iso2texありiso-tex2iso、非常にうまく機能しますが\OEŒ.

于 2014-05-10T17:28:30.417 に答える