0

テキストファイルの場合と同じように、xlsおよびxlsx(MS Excel)ファイルをsparkで行ごとに読み取りたいですか、それともどのようにしますか?

スパークを使用して、1 GB などの大きな xls ファイルを読み取るパフォーマンスを向上させたいと考えています。そのため、テキスト ファイルの場合と同様に、ファイルを部分的に読み取るためにスパークが必要です。

行ごとかどうかに関係なく、sparkでExcelファイルからデータを読み取るにはどうすればよいですか?

とにかくsparkを使用してxlsファイルのエントリを読みたいだけです。

提案してください。

ありがとう!!!

4

4 に答える 4

2

でそれを行うことはできませんspark。それはそれを意図したものではありません。Apache POIなどの別のライブラリを使用して Excel を読み取り、そのデータをテキストとしてスパークするようにフィードします。

于 2015-07-29T07:15:32.627 に答える