Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
ファイル全体のコンテンツを取得するのではなく、ファイルの特定のセクション(ある場合)を取得したいので、javaでdoc、pdf、pptなどのセクションまたは段落ごとにファイルのコンテンツを読みたいです。誰かが教えてくれます、セクションまたは段落のいずれかでファイルの内容を読み取るにはどうすればよいですか………..
ありがとう
これは、問題のファイルの形式に完全に依存します。たとえば、.docxファイルがある場合は、XMLパーサーを使用して結果を反復処理するか、XPathを使用してすべての段落、セクション、または抽出したいものを見つけることができます。
.docx
他のファイル形式の場合は、別のアプローチを見つける必要があります。ファイルの種類によってデータの保存方法が異なるため、ファイルの特定の部分を抽出する単一の方法はありません。ほとんどの場合、ファイルタイプごとに1つずつ、多数のライブラリを収集する必要があります。