python - ドキュメントに画像が含まれている場合、python-docx でテキストを読み取る際の問題

質問する 2014-06-28T01:21:31.780

322 次

画像を含むドキュメントからのテキストの解析に問題があります。

Ubuntu 12.04.4 LTS (GNU/Linux 3.2.0-60-generic x86_64) を実行している Ubuntu Linux マシンでバージョン 0.7.0 の Python docx を使用しています。

私はこのロジックを使用しています：

```

        document = Document(path)
        # Get all paragraphs
        paras = document.paragraphs

        text = ""

        # Push the text from the paragraph on a single string
        for para in paras:
            # Don't forget the line break
            text += "\n" + para.text

        return text.strip()

```

画像がある場合、このプロセスは失敗します。

私が間違っていることはありますか？

python - ドキュメントに画像が含まれている場合、python-docx でテキストを読み取る際の問題

1 に答える 1

Related

Reference