Word 文書の 2 つのテキストの間にある特定の表のリストを抽出しようとしています。私はこれにpython docxを使用していますが、私が直面しているのは、テキストを使用して解析できることです
document.paragraphs[index].text
テーブルは使用して解析されますが、
document.tables[index].cell[row,col]
これにより、テキストと表が分離され、表のリストを 2 つのテキストの間に含めることが難しくなります。私が試みているアプローチは、以下のフォームの各リストの要素を使用して、段落/テーブルのアドレスを取得することです。
<docx.text.paragraph.Paragraph object at 0x04299FD0>
次に、各テーブルのアドレスを抽出し、それが開始テキストのアドレスと終了テキストのアドレスの間にあるかどうかを確認します。しかし、問題は、すべてのテーブルアドレスがテキストの開始アドレスと終了アドレスよりも大きく、アドレスがドキュメントを通じて徐々に連続していると仮定したため、python docx がそれらのアドレスを見つける方法に関するドキュメントが見つからなかったことです。この方法は機能しますか? Word 文書内の 2 つのテキスト間にあるこれらの表を確認するには、他にどのようなアプローチを試みることができますか?