問題タブ [python-docx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Docx : 2 つの指定された文字列の間でテーブルを抽出する
Word 文書の 2 つのテキストの間にある特定の表のリストを抽出しようとしています。私はこれにpython docxを使用していますが、私が直面しているのは、テキストを使用して解析できることです
テーブルは使用して解析されますが、
これにより、テキストと表が分離され、表のリストを 2 つのテキストの間に含めることが難しくなります。私が試みているアプローチは、以下のフォームの各リストの要素を使用して、段落/テーブルのアドレスを取得することです。
次に、各テーブルのアドレスを抽出し、それが開始テキストのアドレスと終了テキストのアドレスの間にあるかどうかを確認します。しかし、問題は、すべてのテーブルアドレスがテキストの開始アドレスと終了アドレスよりも大きく、アドレスがドキュメントを通じて徐々に連続していると仮定したため、python docx がそれらのアドレスを見つける方法に関するドキュメントが見つからなかったことです。この方法は機能しますか? Word 文書内の 2 つのテキスト間にあるこれらの表を確認するには、他にどのようなアプローチを試みることができますか?
python - XML ファイル内のテキスト文字列のみを変更しても、.docx エンケースメントの整合性と機能を維持できますか?
Microsoft Excel スプレッドシートにデータを入力し、そのデータが対話して他のドキュメントや Web フォームに書き込みたいと考えています。
成功したら、xlwings を使用して Excel スプレッドシートからデータを取得しています。現在、私は .docx ファイルでの作業に行き詰まっています。ここでの目標は、Excel データを Microsoft Word .docx ファイル テンプレートの特定の部分に書き込み、新しいファイルを作成することです。
私の具体的な質問は次のとおりです。
word/document.xml ファイル内のテキスト文字列だけを変更しても、その .docx エンケースメントの整合性と機能を維持できますか? Word 文書にわずかな変更を加えただけでも、XML コードにはさまざまな変更が加えられる可能性があるようです。私は python-docx と lxml を使用してきましたが、このルートでやりたいことが可能かどうかはわかりません。
共有する提案や経験は大歓迎です。Google 検索で簡単に見つけられるすべての記事を少なくとも 5 回は読んだと思います。
説明が必要な場合はお知らせください。
注意すべき点: コーディングを始めたのは約 2 か月前です。その間集中的に取り組んできたので、基本的な概念は理解できたと思いますが、知識には深刻なギャップがあります。
私のツールは次のとおりです: Yosemite 10.10、Microsoft Office 2011 for Mac
python-2.7 - docx の一部を新しい docx に抽出する
テキストだけのdocxファイルがあります。元の docx のページの一部だけを含む新しい docx ファイルを作成したいと考えています。これには python-docx を使用しています。これまでのところ、元の docx ドキュメントを横断し、元の必要な各段落/ランを次のように新しいドキュメントにコピーすることができました (この例では正確なコピーが作成されるはずです)。
すべてのスタイル情報をコピーしていますが、出力に一部の書式設定が欠けているため、何かが欠けているようです。
python - Pythonでテーブルヘッダーセルを太字と下線の両方にするにはどうすればよいですか?
Python 3.4 を使用してテーブルを作成していますが、ヘッダーを太字と下線の両方にしたいと考えています。次のコードは、ヘッダーを太字にします。
3行目を次のように変更すると:
テキストに下線が引かれますが、太字にはなりません。ヘッダーのテキストを太字と下線の両方にする方法はありますか?
python - Python Docx - セクション - ページの向き
次のコードはlandscape
方向を使用しようとしますが、ドキュメントは次のように作成されpotrait.
ます。
コードを XML として読み返すと、
私はセクションタグが一番下ではなく一番上のTEXTタグの上に来ると仮定して、XMLをよく知りません????