画像を含むドキュメントからのテキストの解析に問題があります。
Ubuntu 12.04.4 LTS (GNU/Linux 3.2.0-60-generic x86_64) を実行している Ubuntu Linux マシンでバージョン 0.7.0 の Python docx を使用しています。
私はこのロジックを使用しています:
```
document = Document(path)
# Get all paragraphs
paras = document.paragraphs
text = ""
# Push the text from the paragraph on a single string
for para in paras:
# Don't forget the line break
text += "\n" + para.text
return text.strip()
```
画像がある場合、このプロセスは失敗します。
私が間違っていることはありますか?