apache - Apache Lucene はテキスト処理用の ETL ツールを置き換えることができますか

翻译自：https://stackoverflow.com/questions/38680882 2016-07-31T04:54:44.067

76 次

15 GB のフラットファイル抽出とその仕様を取得しました。これは、各行レコードを識別し、必要な情報を収集するために各行を分割する方法に役立ちます。このバルクファイルのテキスト処理はjavaではできないと思ったので、ETLツールを利用しようと思っています。でも今はLuceneについて読むようになりました。今、本当に混乱しています。以下は私の疑問です：

Apache Lucene は、メモリの問題なしに 15GB のフラットテキストファイルを処理できますか。
各行を読み取り、識別子を識別し、識別子に基づいて行データを分割し、マップされたデータベースにロードする15GBフラットファイルのパフォーマンスベンチマークは何ですか.
このタスクに Apache Lucene を使用できますか、それとも ETL ツールを使用できますか?

apache - Apache Lucene はテキスト処理用の ETL ツールを置き換えることができますか

0 に答える 0

Related

Reference