問題タブ [sqldf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - R で .dump ファイルを読み取るにはどうすればよいですか?
data.frame
Rで分析できるように変換したい.dumpファイルがあるとしsqldf
ます。データフレームでSQLコマンドを使用できることはわかっていますが、このパッケージまたは別のパッケージを使用して.DUMPファイルを読み取ることもできます?
この投稿では、SQL を使用して .dump ファイルを復元する方法を示していますが、この構文は では機能しませんsqldf
。もちろん、SQL 構文を適切に使用する方法がわからないので、おそらく私のせいです。
これは、言及された投稿に基づいて、構文が次のようになると私が思うものです。
r - このddplyを高速化するには?
次のような製品のペアの類似性に関するデータフレームがあります。
次のような各製品について、最も類似した上位 10 個の製品を選択したいと考えています。
これはデータセットが小さい場合は機能しましたが、製品番号が 30k に達すると遅すぎます...
また、次のようなランクとパーティションを模倣するために、sqldfを試しました...
sql_top10<-" a.product1、a.product2、a.similarity、count(*) を productpairs a からのランクとして選択 a.product1=b.product1 および a.similarity>=b.similarity グループの a.productpairs b を a. product1,a.simlarity"
しかし、これはさらに悪いことです...何か提案はありますか?
sql - Rとsqldfでヘッダーのないテキストファイルのn番目の列のみを読み取る
この質問のような同様の問題があります: SQLDFまたはread.csv.sqlを使用してN番目の列ごとに選択する
大きなファイルのいくつかの列を読みたい (150 行、500,000 列を超えるテーブル、スペースで区切られ、数値データで埋められ、32 ビット システムのみが利用可能)。このファイルにはヘッダーがないため、上記のスレッドのコードが機能せず、新しい投稿を書くことにしました。
この問題を解決するアイデアはありますか?
私はそのようなことを考えましたが、 fread または read.table の結果も問題ありません:
r - Rで.txtファイルの一部の行をクエリ/取得しても結果がありません
.txt ファイルのいくつかの行をクエリする際に問題があります。私は多くのことを試し、何日もウェブを検索しましたが、解決策はありませんでした. あなたは私の最後の希望です。
そのため、venues.txt ファイルが含まれています。
何千もの会場に。
このファイルを R にインポートしました。
sqldf パッケージを使用してこのファイルをクエリしたところ、機能しました。ただし、一部の会場 (主に会場 ID 40000 から 60000 の間の会場) のデータを取得/クエリできないことに気付きました。たとえば、venueID 59900 を照会することはできません。
一方、ファイルの最後の会場、venueID 85927 についても可能です。
問題は、このファイルをインポートして、さまざまな方法でクエリを実行しようとしたことです。結果はありません!!
テキストファイルを開いてこれらの会場を調べたところ、すべて問題ありませんでした。すべての情報が含まれ、カンマで区切られています。
確認するために、新しい testven.txt ファイルを作成し、これらの「取得されていない」会場の情報をいくつかコピーして、それを testven.txt に貼り付けました。このファイルをインポートして、venuesID 59900 を照会したところ、結果が得られました。
何が悪いのかわからず、それは私を殺しています。
考えられることはすべて実際に試しましたが、私にとっての時間は非常に重要です。
アップデート:
これは会場ファイルの構造です:
これは、testven ファイルの構造です。
なんと、柱の種類に違いが!!!testven ファイルは会場ファイルのサブセットですが。