何千もの .doc ファイルを HTML に変換する必要があります。これらのドキュメントには、MathType 方程式、Word 図面 (ベクトル図面) が含まれており、図面にはさらに多くの方程式オブジェクト自体が含まれています。
Microsoft.Office.Interop.Word を使用して、.doc をフィルター処理された HTML と "フィルター処理されていない" HTML に保存することができました (この最後のモードには、複数の .wmz ファイルが生成されるという利点があります)。残念なことに、MathType SDK は、プロセスで生成される wmz ファイル内のすべての方程式を変換できません (SDK に付属の wmf の例は、LaTeX に問題なく変換されます..)。 要約:
- どの wmf ファイルが MathType 方程式で、どれが単語の描画であるかを知る必要があります。
- MathType 方程式である wmf ファイルを LaTeX に変換できるようにする必要があります。
- 結果が私たちの好みに合わないことが非常に多いため、図面を変換するためにいくつかのかなり優れたwmfからsvgへのコンバーターが必要です。
- 単語の描画に含まれる数式にアクセスする必要があります。
何千ものファイルがあるため、これはすべて自動化する必要があります。
これについて経験のある人はいますか?