こちらの手順をお試しください:http: //zanedp.livejournal.com/201222.html
LaTeXファイルをプレーンテキストに変換するシーケンスは次のとおりです。
$ latex file.tex
$ catdvi -e 1 -U file.dvi | sed -re "s/\[U\+2022\]/*/g" | sed -re "s/([^^[:space:]])\s+/\1 /g" > file.txt
catdviの-e1オプションは、ASCIIを出力するように指示します。1ではなく0を使用すると、Unicodeが出力されます。Unicodeには、箇条書き、emdash、ギリシャ文字などのすべての特殊文字が含まれます。また、「fi」や「fl」などの一部の文字の組み合わせの合字も含まれます。あなたはそれが好きではないかもしれません。したがって、代わりに-e1を使用してください。-Uオプションを使用して、不明な文字のUnicode値を出力するように指示します。これにより、文字を簡単に見つけて置き換えることができます。
コマンドの2番目の部分は、箇条書き文字(•)を指定するために使用される文字列[U + 2022]を検索し、それらをアスタリスク(*)に置き換えます。
3番目の部分は、行頭(インデント)のスペースを保持しながら、テキストを完全に揃えるためにcatdviが投入した余分な空白をすべて使い果たします。
これらのコマンドを実行した後、.txtファイルで文字列[U +を検索して、ASCIIにマップできないUnicode文字が残っていないことを確認して修正することをお勧めします。