6

Stackoverflowデータ ダンプを手に入れたところですが、投稿の Body フィールドが Markdown ではなく HTML になっていることにがっかりしています。回答を編集しようとすると表示されるので、元のデータベースに Markdown があると思われます。

大量の回答から Markdown を回復したい。コマンド ライン ツールまたはある種の Lua または C ライブラリを使用して、バッチ モードで何百ものエントリを処理するので、wmd Markdown エディタのような対話型ツールは適していません。Stackoverflow のデータ ダンプから Markdown を復元するのに役立つツールを教えてください


(関連する質問、重複ではありません: wmd 内で HTML を Markdown に戻します。)

4

2 に答える 2

5

Markdownifyは HTML を Markdown に変換します。

関連項目: MetaSO / SO データ ダンプから Markdown を復元できますか?

于 2009-08-20T17:26:54.453 に答える
2

pandoc を見てみましょう: http://johnmacfarlane.net/pandoc/

pandoc には html2markdown ツールが含まれており、非常にうまく機能します。プログラムはコマンド ラインから実行されるため、バッチ変換が非常に便利です。

ここにマニュアルページがあります: http://johnmacfarlane.net/pandoc/html2markdown.1.html

于 2009-09-15T16:37:43.283 に答える