たくさんの(10k以上の)ドキュメントを入手しました。実際には、.docだけでなく、docx、pptx、xlsxに変換する必要がある.pptファイルと.xlsファイルもあります。これらのドキュメントをSharePointにアップロードし、SharePoint、Visual Studio、Office2010Proなどの環境を用意します。
これを実行するためのベストプラクティスはありますか?Aspose.Wordsを少し見てきましたが、1回の変換では2500米ドルが少し上回っているようです。
たくさんの(10k以上の)ドキュメントを入手しました。実際には、.docだけでなく、docx、pptx、xlsxに変換する必要がある.pptファイルと.xlsファイルもあります。これらのドキュメントをSharePointにアップロードし、SharePoint、Visual Studio、Office2010Proなどの環境を用意します。
これを実行するためのベストプラクティスはありますか?Aspose.Wordsを少し見てきましたが、1回の変換では2500米ドルが少し上回っているようです。
microsoft interop dllを使用する必要があり、msoffice2007または2010が必要です。多かれ少なかれ最も安全な方法です。しかし、あなたが10K以上のドキュメントを言っているように、それは多くの時間がかかります。その3つのステップのプロセス。ファイルを開きます。ファイルとして保存し、すべてのファイルにループしてファイルを閉じます。あなたは答えで提供されるリンクの助けを借りることができます。
たぶん役に立つ、
PowerShell を使用して DOC を DOCX に変換する
http://row5is.wordpress.com/2012/07/06/convert-doc-to-docx-using-powershell/
基本的な Powershell - Word Docx を PDF に一括変換
http://kiquenet.wordpress.com/2014/02/20/convert-doc-office-97-2003-to-docx-office-2010/
私見、それはC#に簡単に移植できます。