問題タブ [pandoc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - HTML im タグを LaTeX のキャプション付きの図に変換する
Wordpress Export XML (wp xml) のコンテンツを解析して LaTex ドキュメントを生成する Python スクリプトを作成しています。これまでのところ、wp xml は を介して解析され、コードはtexmllxml.etree
によって処理される新しい xml ツリーを生成します。これにより、tex ファイルが生成されます。
現在、各投稿を特定のメタデータ (タイトル、公開日、タグ、コンテンツ) と共に抽出しています。メタデータは問題ありませんが、コンテンツ部分が少し問題です。wp xml 内では、コンテンツはプレーンな HTML/Wordpress マークアップの CDATA 構造として含まれています。それをラテックスに変換するには、 pandocを選択してコンテンツを解析します。TeXml はインライン LaTeX をサポートしているため、コンテンツはプレーンな LaTeX としてツリーに追加されます。
a
この場合、ほとんどの html タグ ( 、strong
、em
...)を既に適切に変換しているため、pandoc を使用することにしました。唯一の問題は、画像の処理方法です。
サブプロセスを使用して pandoc とやり取りします。
サンプル投稿は次のようになります
キャプションが図として埋め込まれた画像が必要です。
pandoc はimg
、タイトルや代替テキストを破棄して、html タグを単純なインライン画像に変換するようです。
ソースを覗いたところ、img
インライン要素としてのみ扱われているようです。(pandoc解析機能)。私はHaskellを知らないので、これが私が得た距離です。
ただし、html をマークダウンに変換すると、alt と title が保持され、結果は次のようになります。
マークダウンを使用すると、結果のラテックス ドキュメントにインライン画像または図を含めることができます。このマークダウンをラテックスに変換すると、結果は
最初の pandoc は、コンテンツを解析するための簡単なソリューションのように見えましたが、pandoc は HTML のインライン ラテックスもサポートしていないため、最初にすべての画像と残りを pandoc で処理できたため、少し行き詰まりました。
img
キャプションを持つラテックスの図環境に埋め込むために、html のタグを (より適切に) 処理する方法について何か考えがありますか?
latex - Pandoc を使用した html から tex への変換で数学モードが生成されない
私はWindowsマシンで作業しています。Rstudio/knitr を使用して、(R)markdown ファイルを作成し、html ファイルに変換します。ソース マークダウン ファイルには、LaTeX 言語で入力された数学が含まれているため、html ファイルには Mathjax が含まれています。
たとえば、マークダウン ファイルには次の LaTeX コードがあります。
したがって、期待される出力は次のとおりです。
この出力は、html ファイルに正しく表示されます。
しかし今、このhtmlファイルをtexファイルに変換しようとしています:
そして、出力 tex ファイルに次のコードを取得します。
(pdf)latex でコンパイルした後、次のレンダリングが得られます。
pandoc - HTML を Markdown として処理せず、定義リストを保持する
Pandoc の定義リスト構文が気に入っています。また、ドキュメントに挿入された未加工の HTML もいくつかあります。
HTML を Markdown として解析したくありません。--strict
Pandoc に HTML を無視させようとしました。これは機能しますが、残念ながら定義リスト機能がオフになります。HTML を使用して DL を作成することもできますが、それは面倒です。(HTML は別のソースからのものであり、そのままにしておく必要があります。)
これをより細かく設定できる設定オプションはありますか?
(マニュアルのraw htmlセクションと定義リスト--strict
セクションを参照してください。どちらも、それらを無効にする方法について説明しています。)
r - Rstudio を使用して、pandoc なしで直接 .Rmd から LaTeX に変換することは可能ですか?
再現可能な例 (rstudio がある場合):
- ファイル | 新しい | R マークダウン
- 次のように保存して、html に編成し
test
ます。
作業ディレクトリに移動
ターミナル(pandocがインストールされている)タイプ
pandoc -s test.md -t latex -o test.tex
(ここに貼り付けた結果)
- pdflatex で pdf に変換します (結果はこちらをご覧ください)
または、.pdf に直接移動して、tex ステージをスキップします。
結果は良好ですが、knitr にスウィーブが組み込まれていることを考えると、多くのステップのように見えます。.Rmd から .tex または .pdf に直接変換できるはずです。右?
markdown - 複雑なテンプレートを含む docx へのマークダウン
Pandoc を使用してビルドを自動化し、Markdown ファイルを DOCX ファイルに変換しました。最終的なドキュメントのスタイリングに参照ドキュメントを使用したことさえあります。私が使用するコマンドは次のとおりです。
はreference.docx
Pandoc によって取得され、Pandoc は参照ドキュメントと同じスタイルでdocs/rendering
レンダリングします。mydoc.docx
ただし、reference.docx
スタイルだけではありません。会社のロゴ、プリアンブルなどが含まれています。
のスタイルとコンテンツの両方を使用して、Markdown コンテンツのマージを自動化するにはどうすればよいですかreference.docx
。私のソリューションは Linux で動作する必要があります。
latex - pandoc がラテックス スタイルの引用を正しく変換しない
\cite{key}
pandoc を使用して tex および pdf ドキュメントを適切に作成できるように、マークダウンでラテックス スタイルの引用を使用したいと考えています。ただし、何かを引用すると、著者名や引用番号などの引用スタイルではなく、括弧内にキーワードが表示されます。つまり、PDF に「This is my citation [1]」と表示されるようにしたいのですが、代わりに「This is my citation [mykey]」と表示されます。また、# References
ヘッダーを追加した後、参照リストが表示されません。ここで何が起こっているのですか?
以下は、これを生成するためのサンプル コマンドと、サンプル ファイルおよび現在の誤った出力ファイル ( test.pdf
) です。
pandoc test.md --biblatex --biblio test.bib --csl chicago-author-date.csl -o test.pdf
test.md
テストビブ
test.pdf
pdf-generation - pandoc から生成された LaTeX の Figure ブロックから `\centering` タグを削除するには?
pandoc を使用してマークダウンから PDF を生成すると、マークダウンは LaTeX に変換されます。カスタマイズしたテンプレートを使用して PDF のスタイルを設定しています。
画像リンクを作成する場合:
次の LaTeX が生成されます。
当然のことながら、画像は PDF を中心に配置されています。
\centering
タグが生成されないようにするにはどうすればよいですか?
markdown - R Markdown ソースと pandoc 変換を使用した Word の図のキャプション
Rstudio を使用して Rmarkdown 言語でレポートを作成してから、md
ファイル (ファイルではなくRmd
)doc
を pandoc を使用して形式に変換します。doc
各図には、出力ファイルにキャプションがあります: "plot of chunk unnamed-chunk-xxx" . もちろん、このキャプションはmd
ファイル内で変更できますが、ファイル内で直接変更できるかどうかは疑問Rmd
です。
ruby - nanoc:オプションをpandoc-rubyに渡すにはどうすればよいですか?
pandoc
を使用するフィルターでnanoc3.5.0を使用しようとしていますpandoc-ruby
。Rules
具体的には、の最後の呼び出しがPandocRuby.convert()
次のようになるように、ファイルからいくつかのオプションを渡すことができません。
上記の呼び出しをカスタムフィルターに入れると、すべてが正常に機能します。Rules
ただし、オプションのセットごとに特別なフィルターを作成する必要がないように、pandocオプションを指定したいと思います。
デフォルトのpandocフィルターは関数として定義されておりrun(content, params={})
、単に。を呼び出しますPandocRuby.convert(content, params)
。正しく呼び出されるparams
ように設定するにはどうすればよいですか?PandocRuby.convert()
の次のディレクティブはRules
機能しません。
最初のディレクティブはRubyエラーになり、2番目のディレクティブは実行されますが、空白のページが表示され、pandocが正しく呼び出されなかったことを示します。私はRubyにあまり詳しくないので、現在の取り組みは暗闇の中での刺し傷にすぎません。
r - md または HTML 出力用に Knitr でページ幅を設定する
私は、統計分析の出力を図とともに作成するために Knitr を持っています。私の分析には、ヘッダーでマークされたいくつかのレベルがあります。横に目次のある素敵な html ページを取得するには、"pander" (pandoc R パッケージ) を使用して .md ファイルを html に変換します。knitr は html ファイルに目次を埋め込まないためです。
問題: パンダーを使用すると、大きな図を左右にスクロールする必要がある固定幅のページ (非常に狭い) が作成されます。.md ページ幅または直接パンダーのいずれかのサイズを変更して、自動幅設定 (任意の画面幅に調整) でページを出力する方法はありますか。
私は解決策を探すのに時間を費やしました。
またはパダー出力パラメーターを調整しますが、運がありませんでした。
誰かが問題の解決策を持っていれば、本当に感謝しています。