1

最近、このような 10 ~ 60k 行のテキスト ファイル (csv) を大量に使用しています。

id1,id2  
id3,id1  
id81,id13  
...

ほとんどの場合、この情報を配列の形式で抽出する必要があります。

id1,id2,id3,id1,id81,id13

または時には、一意の要素配列:

id1,id2,id3,id81

次に、結果が私のコード (Java) によって使用され、何かが実行されます。

現在、ほとんどの場合、ファイルの読み取り、ロジック、および ID のリストを返すことから、タスクを実行する Java 関数を作成します。

おそらくコマンドラインを介して、これを達成するためのより良い、より迅速な方法はありますか?

アップデート:

ファイルを読み取って何かを行うアプリを作成するように依頼された場合、そのロジックを Java で作成することは間違いありませんが、私の場合は、データ ウェアハウスから取得する大量のテキスト ファイルを処理する必要があります。 、そこから関連情報を抽出し、Java ベースのアプリで実行します。

さて、これは私のアプリの実験と評価のためだけです。

4

2 に答える 2

1

入力内容をファイル test.csv にコピーしました。

$ cat test.csv 
id1,id2  
id3,id1  
id81,id13  

'tr' ユーティリティを使用すると、次のことができます。

$ cat test.csv | tr '\n' ',' | tr -d ' '

そしてあなたは持っています:

id1,id2,id3,id1,id81,id13
于 2011-10-03T21:50:49.877 に答える
0

あなたのJavaコードが何かばかげたことをしていない限り、それは他のものと同じスピードの球場にあるでしょう。

コマンドラインツールには、コードよりも高速にする魔法はありません。

于 2011-10-03T21:43:19.640 に答える