Rで行単位の処理を回避するのが最善の方法だと思っていました。行単位の処理のほとんどは、内部Cルーチンで実行されます。例:データフレームがありますa
:
chromosome_name start_position end_position strand
1 15 35574797 35575181 1
2 15 35590448 35591641 -1
3 15 35688422 35688645 1
4 13 75402690 75404217 1
5 15 35692892 35693969 1
私が欲しいのは、ストランドが正か負か、startOFgene
asstart_position
または。に基づいていend_position
ます。ループを回避する1つの方法は、for
data.frameを+1ストランドと-1ストランドで分離し、選択を実行することです。スピードアップする他の方法は何ですか?行ごとに他の複雑な処理がある場合、このメソッドはスケールアップしません。