問題タブ [sqldf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
166 参照

sql - sqldf を使用して count(*) > 2000 の行のみを表示する

以下のコードを使用して最初の 2000 行を除くすべてを選択しようとしていますが、次のエラーが発生します。

0 投票する
1 に答える
744 参照

r - sqldf file.format で一部の colClasses のみを指定するにはどうすればよいですか?

sqldf に問題のある列を含む CSV ファイルがいくつかあり、一部の数値列が文字として分類されます。すべての列ではなく、それらの列のクラスを指定するにはどうすればよいですか? 多くの列があり、必ずしもすべてのクラスを指定する必要はありません。

これらの問題のある列のデータの多くはゼロであるため、数値 (または実数) データ型の場合、sqldf はそれらを整数として読み取ります。read.csv がクラスを正しく割り当てることに注意してください。私は適切なプロパティ (最初の 50 の値が 0、次に 51 行目の 1.45 の値) を持つ適切なデータ セットを生成するほど賢くありませんが、データをロードするための呼び出しの例を次に示します。

このエラーを返します:

どうにかして別の read.table 呼び出しを使用して、データ型を解決できますか? すべての列を文字として読み取り、一部を数値に変換できますか? 文字である少数の数値があり、すべての数値列よりもそれらを指定する方が簡単です。私はこの醜い部分的な解決策を思いつきましたが、最終行で同じエラーメッセージで失敗します:

0 投票する
3 に答える
122 参照

r - R を使用した select-from where プロシージャ

私は2つのデータフレームを持っています.これが最初のものです:

そして2番目のもの:

私がしたいのは、 (a、b、c など) のdf2各値(この場合はすべての行) がinでグループ化された行よりも大きいの行を取得することです。pd=1y2y1pdf

この説明はおそらく意味をなさないので、キックする必要がある 2 行:行 1 in df2、 for は in よりも大きいため、行6afor inの値が 4 であるため、 inの値は 3 です。 .y2=3y1=2dfcdf2ycdf

私はdata.tablesを扱っているので、「data.table-solution」がいいでしょう。

0 投票する
3 に答える
5322 参照

r - Rでsqldfパッケージを使用して一意の行を選択する

~1.9M 行と 32 列の csv ファイルがあります。また、RAMが限られているため、メモリへのロードが非常に不便です。その結果、私はデータベースを使用することを考えていますが、このテーマについて詳しい知識を持っていないため、このサイトを見回しましたが、これまでのところ実行可能なソリューションは見つかりませんでした.

CSV ファイルは次のようになります。

.... .... 最大 190 万行

ご覧のとおり、「ケース」列は繰り返されますが、データフレームにインポートする前に一意のレコードのみを取得したいと考えています。だから私はこれを使用しました:

ただし、次のエラーが表示されます。

私がここに欠けている明らかなものはありますか?よろしくお願いします。

0 投票する
2 に答える
352 参照

r - ggplot2円グラフのエラー

次のコードを使用して、ggplot2 で円グラフを作成しています。これには、「MotT」の値ごとに 1 つずつ、2 つの円グラフが隣り合って含まれています。各円グラフは、各「モデル」の比率をどのようにする必要があります。これが私のコードです:

"df=sqldf("select..." を実行しようとすると、次のエラーが表示されます。

そしてもちろん p は空です。私は得る

呼んでみると。

どんな助けでも大歓迎です!ありがとう

0 投票する
1 に答える
545 参照

sql - SQLDF Left Join で引き続きテーブル A から行を削除する

これがすでにここで回答されている場合は申し訳ありませんが、私の問題については何も見つかりません。

私は年月の時系列と、多くの種のバイオマスの時系列データを持っています。15 の特定の種の時系列を分離する必要があります。残念ながら、特定の月に特定の種の個体に遭遇しなかった場合、データは入力されず、0 があるはずの時系列にギャップが残ります。これを改善するために、種データ (右側のテーブル) を完全な時系列 (左側のテーブル) に左結合しようとしています。残念ながら、私の出力結合ではまだデータのない月が欠落しています。たとえば、1986 年の月 1 が欠落しています。これは、右側のテーブルにその月のデータがないためです。左結合にはこれらの行が含まれるべきだと思っていましたが、右側の列は空白のままにしました。

私は以下のコードを持っています。あなたが提案できるものは何でもいただければ幸いです。ありがとう!

編集

自分で答えて申し訳ありませんが、その方法を理解したので、他の誰かがこの同じ問題に遭遇した場合に備えて、これを残しておきたいと思いました。問題は、右側のテーブルだけが結合に入力されるのではなく、最終出力を制限する WHERE 引数にありました。私が使用したコードは以下です。

0 投票する
1 に答える
2388 参照

sql - R言語sqldfパッケージ更新テーブルが機能しない

csvファイルからRにいくつかのデータをエクスポートしました。データを更新するためにsqldfパッケージを使用しています。以下のクエリが実行されます。csv ファイルを提供できますが、ここにファイルを添付する方法がわかりません :(

しかし、クエリの下で実行すると実行されません:(更新テーブル部分を除いて、クエリの残りの部分は上記のクエリの一部であるため、興味深いです。

update table コマンドの何が問題になっていますか? コードをSQL開発スタジオで実行すると問題なく動作します...しかし、コードがRで実行されることをお勧めします

アップデート:

以下のコードにどのような変更を加える必要がありますか????

0 投票する
1 に答える
35 参照

r - 特定の行に関連付けられたデータを保持しながら、広範なデータフレームで行名を組み合わせる

私はビールの名前で構成される広範なデータフレームを持っており、そのレビューはビールごとにいくつかの繰り返しがあります。それらを組み合わせて各レビューセットをビール名の1つのリストとその全体的なレビューの平均に減らす方法について誰か提案がありますか?

すなわち

これが私がこれまでに試したことです

これまでのところ、このコードはクラッシュするだけです ^^^^

0 投票する
0 に答える
102 参照

r - R でのルールのテスト

テストする必要がある一連のルールがあります。アイリス データセットを使用しており、生成されたルールは次のようになります。

ルール、クラス

PetalLength > 2.45 AND PetalWidth <= 1.7、逆色 PetalWidth > 0.8 AND PetalLength <= 4.75、逆色

ここで、データセットを介して各ルールを渡し、データフレームを取得します。ここで、行はデータセットのレコードで、列はルールです。各ルールがレコードを介して渡されると、ルールがレコードを正しく分類する場合の場合、そのレコードのスコアは 1、そうでない場合はスコアが 0 になり、これらの値は各行のデータフレームに格納されます。すべてのルールを通過した後に行の合計を取得したいのですが、行の合計が特定の値 (たとえば 3) を超えると、ルールの通過が停止します。

これまでのところ、データセットを介して各ルールを実行し、特定のルールが正しく分類したインスタンスの数を取得するコードを作成しましたが、この側面をコーディングする方法がわかりません。誰かが私を助けてくれますか?

このコードは、各ルールがすべての行で実行されるデータ フレームを取得し、最後に列の合計、つまりその特定のルールによって正しく分類されたインスタンスの数を示します。