問題タブ [dbplyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: dbplyr: postgres: テーブルにインデックスを作成する方法
ユーザーには大きなテーブルがあります (30 億行以上)。今後数か月のクエリを高速化するには、リモート データベースにインデックスを作成する必要があります。
と呼ばれる接続があると仮定するとconn
、インデックスを作成し、データベースから切断した後もそれを永続化する最良の方法は何ですか。
例えば、
上記のコードは機能しているように見えますが、インデックスを何らかの方法で検証するにはどうすればよいでしょうか (それが本当に存在することを確認し、将来のクエリを高速化します)。つまり、ユーザーはインデックスの存在をどのように確認できるのでしょうか? また、何らかの方法で COMMIT コマンドを発行する必要がありますか?
r - dplyr/dbplyr: sql テーブルと df 速度
現在、計算を行うためにdplyrを使用して関数を作成しています。関数はtbl_sqlオブジェクトを入力すると非常に遅くなりますが、 data.frame を入力するとかなり高速です。
例、
system.time(f(df))
1 秒もかかりません。(データフレーム)
system.time(f(dfdb))
約2秒かかります。(tbl_sql)
私の現在の関数は長く、入力データも大きく、(data.frame)は(tbl_sql)オブジェクトよりも 10 倍以上高速であることがわかりました。
何故ですか?誰か説明してくれませんか。