問題タブ [sqldf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - sqldf を使用して count(*) > 2000 の行のみを表示する
以下のコードを使用して最初の 2000 行を除くすべてを選択しようとしていますが、次のエラーが発生します。
r - sqldf file.format で一部の colClasses のみを指定するにはどうすればよいですか?
sqldf に問題のある列を含む CSV ファイルがいくつかあり、一部の数値列が文字として分類されます。すべての列ではなく、それらの列のクラスを指定するにはどうすればよいですか? 多くの列があり、必ずしもすべてのクラスを指定する必要はありません。
これらの問題のある列のデータの多くはゼロであるため、数値 (または実数) データ型の場合、sqldf はそれらを整数として読み取ります。read.csv がクラスを正しく割り当てることに注意してください。私は適切なプロパティ (最初の 50 の値が 0、次に 51 行目の 1.45 の値) を持つ適切なデータ セットを生成するほど賢くありませんが、データをロードするための呼び出しの例を次に示します。
このエラーを返します:
どうにかして別の read.table 呼び出しを使用して、データ型を解決できますか? すべての列を文字として読み取り、一部を数値に変換できますか? 文字である少数の数値があり、すべての数値列よりもそれらを指定する方が簡単です。私はこの醜い部分的な解決策を思いつきましたが、最終行で同じエラーメッセージで失敗します:
r - R を使用した select-from where プロシージャ
私は2つのデータフレームを持っています.これが最初のものです:
そして2番目のもの:
私がしたいのは、 (a、b、c など) のdf2
各値(この場合はすべての行) がinでグループ化された行よりも大きいの行を取得することです。p
d=1
y2
y1
p
df
この説明はおそらく意味をなさないので、キックする必要がある 2 行:行 1 in df2
、 for は in よりも大きいため、行6a
はfor inの値が 4 であるため、 inの値は 3 です。 .y2=3
y1=2
df
c
df2
y
c
df
私はdata.tablesを扱っているので、「data.table-solution」がいいでしょう。
r - Rでsqldfパッケージを使用して一意の行を選択する
~1.9M 行と 32 列の csv ファイルがあります。また、RAMが限られているため、メモリへのロードが非常に不便です。その結果、私はデータベースを使用することを考えていますが、このテーマについて詳しい知識を持っていないため、このサイトを見回しましたが、これまでのところ実行可能なソリューションは見つかりませんでした.
CSV ファイルは次のようになります。
.... .... 最大 190 万行
ご覧のとおり、「ケース」列は繰り返されますが、データフレームにインポートする前に一意のレコードのみを取得したいと考えています。だから私はこれを使用しました:
ただし、次のエラーが表示されます。
私がここに欠けている明らかなものはありますか?よろしくお願いします。
r - ggplot2円グラフのエラー
次のコードを使用して、ggplot2 で円グラフを作成しています。これには、「MotT」の値ごとに 1 つずつ、2 つの円グラフが隣り合って含まれています。各円グラフは、各「モデル」の比率をどのようにする必要があります。これが私のコードです:
"df=sqldf("select..." を実行しようとすると、次のエラーが表示されます。
そしてもちろん p は空です。私は得る
呼んでみると。
どんな助けでも大歓迎です!ありがとう
sql - SQLDF Left Join で引き続きテーブル A から行を削除する
これがすでにここで回答されている場合は申し訳ありませんが、私の問題については何も見つかりません。
私は年月の時系列と、多くの種のバイオマスの時系列データを持っています。15 の特定の種の時系列を分離する必要があります。残念ながら、特定の月に特定の種の個体に遭遇しなかった場合、データは入力されず、0 があるはずの時系列にギャップが残ります。これを改善するために、種データ (右側のテーブル) を完全な時系列 (左側のテーブル) に左結合しようとしています。残念ながら、私の出力結合ではまだデータのない月が欠落しています。たとえば、1986 年の月 1 が欠落しています。これは、右側のテーブルにその月のデータがないためです。左結合にはこれらの行が含まれるべきだと思っていましたが、右側の列は空白のままにしました。
私は以下のコードを持っています。あなたが提案できるものは何でもいただければ幸いです。ありがとう!
編集
自分で答えて申し訳ありませんが、その方法を理解したので、他の誰かがこの同じ問題に遭遇した場合に備えて、これを残しておきたいと思いました。問題は、右側のテーブルだけが結合に入力されるのではなく、最終出力を制限する WHERE 引数にありました。私が使用したコードは以下です。
sql - R言語sqldfパッケージ更新テーブルが機能しない
csvファイルからRにいくつかのデータをエクスポートしました。データを更新するためにsqldfパッケージを使用しています。以下のクエリが実行されます。csv ファイルを提供できますが、ここにファイルを添付する方法がわかりません :(
しかし、クエリの下で実行すると実行されません:(更新テーブル部分を除いて、クエリの残りの部分は上記のクエリの一部であるため、興味深いです。
update table コマンドの何が問題になっていますか? コードをSQL開発スタジオで実行すると問題なく動作します...しかし、コードがRで実行されることをお勧めします
アップデート:
以下のコードにどのような変更を加える必要がありますか????
r - 特定の行に関連付けられたデータを保持しながら、広範なデータフレームで行名を組み合わせる
私はビールの名前で構成される広範なデータフレームを持っており、そのレビューはビールごとにいくつかの繰り返しがあります。それらを組み合わせて各レビューセットをビール名の1つのリストとその全体的なレビューの平均に減らす方法について誰か提案がありますか?
すなわち
これが私がこれまでに試したことです
これまでのところ、このコードはクラッシュするだけです ^^^^
r - R でのルールのテスト
テストする必要がある一連のルールがあります。アイリス データセットを使用しており、生成されたルールは次のようになります。
ルール、クラス
PetalLength > 2.45 AND PetalWidth <= 1.7、逆色 PetalWidth > 0.8 AND PetalLength <= 4.75、逆色
ここで、データセットを介して各ルールを渡し、データフレームを取得します。ここで、行はデータセットのレコードで、列はルールです。各ルールがレコードを介して渡されると、ルールがレコードを正しく分類する場合の場合、そのレコードのスコアは 1、そうでない場合はスコアが 0 になり、これらの値は各行のデータフレームに格納されます。すべてのルールを通過した後に行の合計を取得したいのですが、行の合計が特定の値 (たとえば 3) を超えると、ルールの通過が停止します。
これまでのところ、データセットを介して各ルールを実行し、特定のルールが正しく分類したインスタンスの数を取得するコードを作成しましたが、この側面をコーディングする方法がわかりません。誰かが私を助けてくれますか?
このコードは、各ルールがすべての行で実行されるデータ フレームを取得し、最後に列の合計、つまりその特定のルールによって正しく分類されたインスタンスの数を示します。