“sqldf”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

166 参照

sql - sqldf を使用して count(*) > 2000 の行のみを表示する

以下のコードを使用して最初の 2000 行を除くすべてを選択しようとしていますが、次のエラーが発生します。

sql r sqldf

2013-07-12T17:29:40.050

0 投票する

1 に答える

744 参照

r - sqldf file.format で一部の colClasses のみを指定するにはどうすればよいですか?

sqldf に問題のある列を含む CSV ファイルがいくつかあり、一部の数値列が文字として分類されます。すべての列ではなく、それらの列のクラスを指定するにはどうすればよいですか? 多くの列があり、必ずしもすべてのクラスを指定する必要はありません。

これらの問題のある列のデータの多くはゼロであるため、数値 (または実数) データ型の場合、sqldf はそれらを整数として読み取ります。read.csv がクラスを正しく割り当てることに注意してください。私は適切なプロパティ (最初の 50 の値が 0、次に 51 行目の 1.45 の値) を持つ適切なデータセットを生成するほど賢くありませんが、データをロードするための呼び出しの例を次に示します。

このエラーを返します：

どうにかして別の read.table 呼び出しを使用して、データ型を解決できますか? すべての列を文字として読み取り、一部を数値に変換できますか? 文字である少数の数値があり、すべての数値列よりもそれらを指定する方が簡単です。私はこの醜い部分的な解決策を思いつきましたが、最終行で同じエラーメッセージで失敗します:

r import sqldf

2013-07-18T11:01:47.590

0 投票する

3 に答える

122 参照

r - R を使用した select-from where プロシージャ

私は2つのデータフレームを持っています.これが最初のものです:

そして2番目のもの：

私がしたいのは、 (a、b、c など) のdf2各値(この場合はすべての行) がinでグループ化された行よりも大きいの行を取得することです。pd=1y2y1pdf

この説明はおそらく意味をなさないので、キックする必要がある 2 行:行 1 in df2、 for は in よりも大きいため、行6aはfor inの値が 4 であるため、 inの値は 3 です。 .y2=3y1=2dfcdf2ycdf

私はdata.tablesを扱っているので、「data.table-solution」がいいでしょう。

r data.table plyr sqldf

2013-08-14T12:44:45.557

0 投票する

3 に答える

5322 参照

r - Rでsqldfパッケージを使用して一意の行を選択する

~1.9M 行と 32 列の csv ファイルがあります。また、RAMが限られているため、メモリへのロードが非常に不便です。その結果、私はデータベースを使用することを考えていますが、このテーマについて詳しい知識を持っていないため、このサイトを見回しましたが、これまでのところ実行可能なソリューションは見つかりませんでした.

CSV ファイルは次のようになります。

.... .... 最大 190 万行

ご覧のとおり、「ケース」列は繰り返されますが、データフレームにインポートする前に一意のレコードのみを取得したいと考えています。だから私はこれを使用しました：

ただし、次のエラーが表示されます。

私がここに欠けている明らかなものはありますか？よろしくお願いします。

r sqlite csv sqldf

2013-08-14T14:45:00.367

0 投票する

2 に答える

352 参照

r - ggplot2円グラフのエラー

次のコードを使用して、ggplot2 で円グラフを作成しています。これには、「MotT」の値ごとに 1 つずつ、2 つの円グラフが隣り合って含まれています。各円グラフは、各「モデル」の比率をどのようにする必要があります。これが私のコードです：

"df=sqldf("select..." を実行しようとすると、次のエラーが表示されます。

そしてもちろん p は空です。私は得る

呼んでみると。

どんな助けでも大歓迎です!ありがとう

r ggplot2 sqldf

2013-08-15T10:34:21.280

0 投票する

1 に答える

545 参照

sql - SQLDF Left Join で引き続きテーブル A から行を削除する

これがすでにここで回答されている場合は申し訳ありませんが、私の問題については何も見つかりません。

私は年月の時系列と、多くの種のバイオマスの時系列データを持っています。15 の特定の種の時系列を分離する必要があります。残念ながら、特定の月に特定の種の個体に遭遇しなかった場合、データは入力されず、0 があるはずの時系列にギャップが残ります。これを改善するために、種データ (右側のテーブル) を完全な時系列 (左側のテーブル) に左結合しようとしています。残念ながら、私の出力結合ではまだデータのない月が欠落しています。たとえば、1986 年の月 1 が欠落しています。これは、右側のテーブルにその月のデータがないためです。左結合にはこれらの行が含まれるべきだと思っていましたが、右側の列は空白のままにしました。

私は以下のコードを持っています。あなたが提案できるものは何でもいただければ幸いです。ありがとう！

編集

自分で答えて申し訳ありませんが、その方法を理解したので、他の誰かがこの同じ問題に遭遇した場合に備えて、これを残しておきたいと思いました。問題は、右側のテーブルだけが結合に入力されるのではなく、最終出力を制限する WHERE 引数にありました。私が使用したコードは以下です。

sql database r sqldf

2013-08-17T19:16:10.233

0 投票する

1 に答える

2388 参照

sql - R言語sqldfパッケージ更新テーブルが機能しない

csvファイルからRにいくつかのデータをエクスポートしました。データを更新するためにsqldfパッケージを使用しています。以下のクエリが実行されます。csv ファイルを提供できますが、ここにファイルを添付する方法がわかりません :(

しかし、クエリの下で実行すると実行されません:(更新テーブル部分を除いて、クエリの残りの部分は上記のクエリの一部であるため、興味深いです。

update table コマンドの何が問題になっていますか? コードをSQL開発スタジオで実行すると問題なく動作します...しかし、コードがRで実行されることをお勧めします

アップデート：

以下のコードにどのような変更を加える必要がありますか????

sql r sqldf

2013-08-19T02:34:03.087

0 投票する

1 に答える

35 参照

r - 特定の行に関連付けられたデータを保持しながら、広範なデータフレームで行名を組み合わせる

私はビールの名前で構成される広範なデータフレームを持っており、そのレビューはビールごとにいくつかの繰り返しがあります。それらを組み合わせて各レビューセットをビール名の1つのリストとその全体的なレビューの平均に減らす方法について誰か提案がありますか?

すなわち

これが私がこれまでに試したことです

これまでのところ、このコードはクラッシュするだけです ^^^^

r plyr sqldf

2013-08-21T21:11:32.850

0 投票する

0 に答える

102 参照

r - R でのルールのテスト

テストする必要がある一連のルールがあります。アイリスデータセットを使用しており、生成されたルールは次のようになります。

ルール、クラス

PetalLength > 2.45 AND PetalWidth <= 1.7、逆色 PetalWidth > 0.8 AND PetalLength <= 4.75、逆色

ここで、データセットを介して各ルールを渡し、データフレームを取得します。ここで、行はデータセットのレコードで、列はルールです。各ルールがレコードを介して渡されると、ルールがレコードを正しく分類する場合の場合、そのレコードのスコアは 1、そうでない場合はスコアが 0 になり、これらの値は各行のデータフレームに格納されます。すべてのルールを通過した後に行の合計を取得したいのですが、行の合計が特定の値 (たとえば 3) を超えると、ルールの通過が停止します。

これまでのところ、データセットを介して各ルールを実行し、特定のルールが正しく分類したインスタンスの数を取得するコードを作成しましたが、この側面をコーディングする方法がわかりません。誰かが私を助けてくれますか？

このコードは、各ルールがすべての行で実行されるデータフレームを取得し、最後に列の合計、つまりその特定のルールによって正しく分類されたインスタンスの数を示します。

r rules random-forest sqldf

2013-08-22T09:34:38.490

問題タブ [sqldf]

Reference