.doc ファイルと .pdf ファイルは正常に出力されますが、.docx ファイルは破損しているという問題があります。
それを解決するために、.docx が破損している理由をデバッグしようとしています。
docx 形式は、余分な文字に関して .pdf や .doc よりもはるかに厳密であることを知りました。したがって、無効な XML を探して、docx ファイル内のさまざまな xml ファイルを検索しました。しかし、私は何も見つかりません。それはすべて正常に検証されます。
今すぐ調査するための指示を誰か提案してもらえますか?
アップデート:
フォルダー内のファイルの完全なリストは次のとおりです。
/_rels
.rels
/customXml
/_rels
.rels
item1.xml
itemProps1.xml
/docProps
app.xml
core.xml
/word
/_rels
document.xml.rels
/media
image1.jpeg
/theme
theme1.xml
document.xml
fontTable.xml
numbering.xml
settings.xml
styles.xml
stylesWithEffects.xml
webSettings.xml
[Content_Types].xml
更新 2:
また、破損の理由は、ほぼ間違いなく、私に代わって不適切なバイナリ ファイルの POST であることに言及する必要がありました。
なぜ docx ファイルはバイナリ ポストで破損するのに、.doc と .pdf は問題ないのですか?
更新 3:
さまざまな docx 修復ツールのデモを試しました。それらはすべてファイルを正常に修復しているように見えますが、エラーの原因についての手がかりはありません。
私の次のステップは、修復されたバージョンで破損したファイルの内容を調べることです.
適切なエラー メッセージを表示する docx 修復ツールを知っている人がいれば、教えていただければ幸いです。実際、私はそれを別の質問として投稿するかもしれません。
更新 4 (2017)
私はこの問題を決して解決しませんでした。以下の回答で提案されているすべてのツールを試しましたが、どれもうまくいきませんでした。
その後、もう少し進んで0000
、Sublime Text で .docx を開くと、ブロックが見つからないことがわかりました。こちらの新しい質問の詳細: httpwebrequest 中に .docx ファイルでこの破損が発生する可能性があるのは何ですか?