5

Mac OSX 10.6.8 のターミナルで次のコードを実行しています。

find . -name \*.html -type f -exec pandoc -o {}.md {} \;

一部のドキュメントを解析しますが、かなりの数でこのエラーが発生します。

pandoc: ./Teaching/how_16825_make-lesson-book.html: hGetContents: invalid argument (invalid byte sequence)

これを修正する方法はありますか?

4

3 に答える 3

3

同じ問題があり、これは Pandoc README.html ファイルにもあります:---

Pandoc は、入力と出力の両方に UTF-8 文字エンコーディングを使用します。ローカルの文字エンコーディングが UTF-8 でない場合は、iconv を介して入力と出力をパイプする必要があります。

iconv -t utf-8 入力.txt | パンドック | iconv -f utf-8

もちろん、最初にiconvをインストールする必要があるかもしれません(Mac Osxにはすでにあると思います)...

http://gnuwin32.sourceforge.net/packages/libiconv.htm Gnu Win32

https://code.google.com/p/win-iconv/ Google Win-Iconv

于 2013-01-27T01:52:12.343 に答える
2

kadeix が言ったように、これは文字エンコーディングの問題です。HTML の charset 宣言を変更しても、何も起こりませんでした。

この問題を解決するためにvimで使用しました::w ++enc=utf-8

于 2012-11-29T17:36:33.377 に答える
0

latin-1 でエンコードされたファイルを解析しようとすると、このエラーが発生します。

このエラーが発生した場合は、pandoc を使用する前に、ファイルを utf-8 で保存して (および html コードの文字セット宣言を変更して) みてください。

于 2012-05-04T13:53:39.607 に答える