問題タブ [vaex]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2295 参照

python - Python Vaex データ型変換

プロジェクトで Python の Vaex ライブラリを利用しています。私はまだVaexに非常に慣れていないので、これが初歩的である場合は申し訳ありません. データ型の変換に問題があります。私の列 'Paid_at' の 1 つに str のデータ型があり、DateTime である必要があります。 df_paid.info

私がこれまでに行ったことは、df から削除され、pandas の to_datetime() を使用して列を変換することでしたが、機能していません。これはpdデータフレームで機能しましたが、次のエラーが表示されるため、何か間違ったことをしています

-------------------------------------------------- ------------------------- ValueError トレースバック (最新の呼び出しが最後) in ----> 1 df_paid['Paid_at'] = pd.to_datetime (df['Paid_at']、errors='強制')

F:\Anaconda3\lib\site-packages\vaex\dataframe.py in setitem (self, name, value) 4431 self.add_column(name, value)
4432 else: -> 4433 self.add_virtual_column(name, value) 4434 else : 4435 raise TypeError(' setitemは、{} ではなく文字列のみを引数として取ります'.format(type(name)))

F:\Anaconda3\lib\site-packages\vaex\dataframe.py in add_virtual_column(self, name, expression, unique) 3249
'# すべての既存の式を書き換えます (渡された式引数を含む) 3250 self._rename(name,名前が変更されました) -> 3251 式 = _ensure_string_from_expression(式) 3252 3253 名前 = vaex.utils.find_valid_name(名前, used=[] 一意でない場合は self.get_column_names())

F:\Anaconda3\lib\site-packages\vaex\utils.py in _ensure_string_from_expression(expression) 764 return expression.expression 765 else: --> 766 raise ValueError('%r is not of string or Expression type, but %r ' % (式、型(式))) 767 768

ValueError: NaT は文字列型または式型ではありませんが、<class 'pandas._libs.tslibs.nattype.NaTType'> です

Paid_at 列を集計可能な DateTime にする方法について、私は少し迷っています。

0 投票する
0 に答える
486 参照

python - カスタム関数を使用したpython vaex groupby

vaex DataFrameArray の groupby 関数を使用してカスタム関数をグループに適用する方法はありますか?

できます:
df_vaex.groupby(['col_x1','col_x2','col_x3','col_x4'], agg=vaex.agg.mean(df_vaex['col_y']))

しかし、パンダを行う方法はありますか:
df.groupby(['col_x1','col_x2','col_x3','col_x4']).apply(lambda x: my_own_function(x['col_y']))

0 投票する
2 に答える
538 参照

python - Python vaexで重複行を削除する

私は python vaex を使用していますが、データフレームに重複した行をドロップする方法がわかりません。たとえば、パンダにはメソッドが存在しますdrop_duplicates()。vaexに同様の機能はありますか?

0 投票する
1 に答える
73 参照

python - Vaex 表示データ

10.11 GB の CSV ファイルがあり、dask を使用して hdf5 に変換しました。これは、str、int、および float 値の混合です。vaex で読み取ろうとすると、スクリーンショットに示されている数字が表示されます。誰かが私を助けてくれますか?

スクリーンショット:

ここに画像の説明を入力

0 投票する
1 に答える
1341 参照

python-3.x - Vaexで重複を削除するには?

ユーザーからいくつかのエントリがあり、このユーザーが私のウェブサイトで行ったインタラクションの数...

34 万行と 70 以上の列があり、Vaex を使用したいのですが、重複を削除するなどの単純なことを行うのに問題があります。

誰かがそれを行う方法について私を助けることができますか?

pandas.drop_duplicates(keep="last") 関数と同じ結果が欲しい

Vaex を使用して期待される結果は次のようになります。

0 投票する
1 に答える
718 参照

python - Vaex でのフィルタリングに名前付き選択を使用する方法

2 つの名前付きセレクションを作成しました

クールです。selectionたとえば、多くの (つまり、統計的な) 関数が提供するパラメーターを使用できます。

しかし、フィルターで名前付き選択を使用する方法もありますか? 何かのようなもの