pptx ファイルを読み取る必要があります。編集中に、スライドから一部のデータを抽出しますが、すべてのデータを抽出するわけではありません。スライドのサンプルを見つけます。{1,2,3} オプション データを除くすべてのデータを読み取ることができます。私も読みたいです
ここにコードがあります。
from pptx import Presentation
prs = Presentation(path_to_presentation)
# text_runs will be populated with a list of strings,
# one for each text run in presentation
text_runs = []
for slide in prs.slides:
for shape in slide.shapes:
if not shape.has_text_frame:
continue
for paragraph in shape.text_frame.paragraphs:
for run in paragraph.runs:
text_runs.append(run.text)