0

現在、次のいずれかを含むファイルからデータを取得しています。

342163477\|405760044\|149007683\|322391022\|77409125\|195978682\|358463993\|397650460\|171780277\|336063797\|397650502\|357636118\|168490006...............

このリストはより長く、最大700の異なる値が含まれています。

それを抽出する最も効率的な方法は何ですか?10/20/50/100の一部に切り刻むことができます...または他のUNIXの方法はありますか?このgrepは、十分に高速なさらなる分析のためにpythonにパイプされます。

4

1 に答える 1

0

それを分割することは、それを悪化させるだけです。縮退した場合を除いて、これは問題ではありませんが、正規表現の長さや複雑さは問題ではありません。実行時間は同じです。

于 2012-10-23T09:22:32.060 に答える