テキストファイルの場合と同じように、xlsおよびxlsx(MS Excel)ファイルをsparkで行ごとに読み取りたいですか、それともどのようにしますか?
スパークを使用して、1 GB などの大きな xls ファイルを読み取るパフォーマンスを向上させたいと考えています。そのため、テキスト ファイルの場合と同様に、ファイルを部分的に読み取るためにスパークが必要です。
行ごとかどうかに関係なく、sparkでExcelファイルからデータを読み取るにはどうすればよいですか?
とにかくsparkを使用してxlsファイルのエントリを読みたいだけです。
提案してください。
ありがとう!!!