私は以下のテキストとpdfファイルを扱っています5KB
。ファイルがテキスト ファイルの場合、フォームからファイルを取得し、必要な入力を文字列で取得して要約します。
file = file.readlines()
file = ''.join(file)
result = summarize(file, num_sentences)
簡単にできますが、pdf ファイルの場合はそれほど簡単ではありません。Python/Djangoのtxtファイルで行ったように、pdfファイルの文を文字列として取得する方法はありますか?