問題タブ [sqldf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
1795 参照

sql - R で .dump ファイルを読み取るにはどうすればよいですか?

data.frameRで分析できるように変換したい.dumpファイルがあるとしsqldfます。データフレームでSQLコマンドを使用できることはわかっていますが、このパッケージまたは別のパッケージを使用して.DUMPファイルを読み取ることもできます?

この投稿では、SQL を使用して .dump ファイルを復元する方法を示していますが、この構文は では機能しませんsqldf。もちろん、SQL 構文を適切に使用する方法がわからないので、おそらく私のせいです。

これは、言及された投稿に基づいて、構文が次のようになると私が思うものです。

0 投票する
1 に答える
246 参照

r - このddplyを高速化するには?

次のような製品のペアの類似性に関するデータフレームがあります。

次のような各製品について、最も類似した上位 10 個の製品を選択したいと考えています。

これはデータセットが小さい場合は機能しましたが、製品番号が 30k に達すると遅すぎます...

また、次のようなランクとパーティションを模倣するために、sqldfを試しました...

sql_top10<-" a.product1、a.product2、a.similarity、count(*) を productpairs a からのランクとして選択 a.product1=b.product1 および a.similarity>=b.similarity グループの a.productpairs b を a. product1,a.simlarity"

しかし、これはさらに悪いことです...何か提案はありますか?

0 投票する
1 に答える
448 参照

sql - Rとsqldfでヘッダーのないテキストファイルのn番目の列のみを読み取る

この質問のような同様の問題があります: SQLDFまたはread.csv.sqlを使用してN番目の列ごとに選択する

大きなファイルのいくつかの列を読みたい (150 行、500,000 列を超えるテーブル、スペースで区切られ、数値データで埋められ、32 ビット システムのみが利用可能)。このファイルにはヘッダーがないため、上記のスレッドのコードが機能せず、新しい投稿を書くことにしました。

この問題を解決するアイデアはありますか?

私はそのようなことを考えましたが、 fread または read.table の結果も問題ありません:

0 投票する
0 に答える
75 参照

r - Rで.txtファイルの一部の行をクエリ/取得しても結果がありません

.txt ファイルのいくつかの行をクエリする際に問題があります。私は多くのことを試し、何日もウェブを検索しましたが、解決策はありませんでした. あなたは私の最後の希望です。

そのため、venues.txt ファイルが含まれています。

何千もの会場に。

このファイルを R にインポートしました。

sqldf パッケージを使用してこのファイルをクエリしたところ、機能しました。ただし、一部の会場 (主に会場 ID 40000 から 60000 の間の会場) のデータを取得/クエリできないことに気付きました。たとえば、venueID 59900 を照会することはできません。

一方、ファイルの最後の会場、venueID 85927 についても可能です。

問題は、このファイルをインポートして、さまざまな方法でクエリを実行しようとしたことです。結果はありません!!

テキストファイルを開いてこれらの会場を調べたところ、すべて問題ありませんでした。すべての情報が含まれ、カンマで区切られています。

確認するために、新しい testven.txt ファイルを作成し、これらの「取得されていない」会場の情報をいくつかコピーして、それを testven.txt に貼り付けました。このファイルをインポートして、venuesID 59900 を照会したところ、結果が得られました。

何が悪いのかわからず、それは私を殺しています。

考えられることはすべて実際に試しましたが、私にとっての時間は非常に重要です。

アップデート:

これは会場ファイルの構造です:

これは、testven ファイルの構造です。

なんと、柱の種類に違いが!!!testven ファイルは会場ファイルのサブセットですが。