問題タブ [rowwise]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rのデータフレーム内の列に対する行単位の操作にrowwise()を使用する代わりの良い方法は何ですか?
データ フレームの列の 1 つで文字列操作を実行しようとしていますTest_df
。このデータフレームには、5mil 近くのレコードがあります。目的は、(ヌルを置き換えた後) 文字列内の文字の出現回数をカウントすることであり、カウントするために を使用しstr_locate
ています。
これは行単位の突然変異であるため、 でrowwise()
関数を使用してみましたdplyr
。
この行の実行には 5 時間以上かかり、非常に最適ではありませんでした。
次に、関数を使用してこのStack Overflow Threadpurrr:pmap
に従ってプロセスを少し高速化しようとしましたが、これはプロセスの高速化には役立ちませんでした。
実行を高速化する方法はありreplace_na
ますstr_locate
か? これを毎月行う必要があります。
pandas - pandas: カテゴリ列の行方向の最大値を計算します
(同じカテゴリの)順序付けられたカテゴリ データの 2 つの列を含む DataFrame があります。最初の 2 列のカテゴリ最大値を含む別の列を作成したいと考えています。以下を設定しました。
次のコードを実行すると、np.nan 項目に問題がありますが、列を比較できます。
マニュアルでは、 max() がカテゴリデータで機能することを示唆しているため、次のように新しい列を定義しようとしています。
これにより、NaN の列が生成されます。なんで?