問題タブ [desctools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
743 参照

c++ - R と Rcpp で最大 n 個の一意の値とその頻度を見つける

数値ベクトル v (既に省略された NA) があり、n 番目に大きい値とそれぞれの頻度を取得したいと考えています。

http://gallery.rcpp.org/articles/top-elements-from-vectors-using-priority-queue/ は非常に高速であることがわかりまし た。

ただし、絆は尊重されません。実際、インデックスは必要ありません。値を返すことも問題ありません。

私が取得したいのは、値と頻度を含むリストです。次のように言います。

n は通常、v の長さに比べて小さいため (簡単に >1e6 になる可能性があります)、一意のベクトル、テーブル、または (完全な) 並べ替えを取得することはお勧めできません。

これまでの解決策は次のとおりです。

うーん、DescTools はまだ最速ですが、Rcpp によって大幅に改善されると確信しています (純粋な R であるため)。

0 投票する
1 に答える
5502 参照

r - Rのクラス内相関係数、NAを処理する方法、および評価者と被験者の間であまり重複しない

k x mマトリックスの評価者間の一致について、icc (クラス内相関係数) テストを実行しようとしています。ここで、kは行 (研究対象) で、mは評価者です。これは 70 x 70 のマトリックスですが、各被験者が 6 回 (範囲 2 ~ 13) しか評価されなかった無作為化された評価者からのものです。

グループが大きいため、研究対象と評価者はあまり重複していません。

これは、私のマトリックスが NA でいっぱいであることを意味します。

件名___評価者1___評価者2___評価者3___評価者4___... 評価者70

件名 1 ____ 3 ______ 1________NA_____NA ____ ...

件名 2_____NA____5 ______NA______2______ ...

Subject3_____6 _____NA_______3 _______5_____ ...

...件名70

私は2つの主な問題を見つける心理ライブラリを試しました:

  • まず、na.rm (または同様の) 関数を使用できません。だから、私はNAに対処する方法がわかりません

  • 次に、テストのタイプ (ICC1、ICC2、または ICC3) を定義できませんでした。R のマニュアルとヘルプに Shrout と Fleiss による ICC タイプが記載されていても、使用されているタイプを確認するための例や関数が見つかりません。

この行は機能しません:

Data_O<-na.omit(iccOTE) icc1<-icc(Data_O, na.rm=TRUE, type = c("合意"), unit = c("単一"), r0 = 0, conf.level = 0.95)

--------- そう: 私は DescTools ライブラリに切り替えました。これは、na.rm 関数を使用するときに役立ちました。次のコードを試しました:

ICC (Data_O、タイプ = c("ICC1k")、conf.level = 0.95、na.rm = TRUE)

次のエラーが発生しました: stack.data.frame(data.frame(ratings)) のエラー: ベクトル列が選択されていません

エラーの意味を探してみましたが、見つかりません。また、ライブラリがkを使用する方法について少し混乱しています。この例でkが (n-1) として使用されているかどうかを理解するための情報はどこにありますか? 2 番目のケースでは、完全に不正確になります。

ありがとうございました!!!

0 投票する
1 に答える
126 参照

r - パッケージ DescTools の Gini 関数を使用した整数オーバーフロー エラー

Gini()fromを使用してジニ係数を計算したいのですがDescTools(重み、信頼区間などを使用して「偏りのない」ジニ係数を簡単に計算できるため)、この関数を「大きな」サンプルで使用するとエラーが発生します。私の側でエラーを生成する簡単な例を次に示します。

警告メッセージ: 1: in sum(x * 1:n) : 整数オーバーフロー - sum(as.numeric(.)) を使用 2: In n * sum(x) : 整数オーバーフローによって生成された NA

何が問題なのかわかりません。私はRバージョン3.3.1(2016-06-21)を使用しています - RStudioバージョン0.99.903および「DescTools」バージョン0.99.17で「Bug in Your Hair」。
編集:まあ、私の数値を整数から数値に変換することはうまくいくようです(しかし、とにかく、私はまだそれを取得していません...):

0 投票する
1 に答える
600 参照

r - 重複する日付範囲の存在と範囲を ID 番号で判断 - 2 つのデータ フレーム

次のように2つのデータフレームがあります。それらは長さが等しくありません:

実際のデータセットの範囲は 10,000 から 1,000,000+ 行です。

の各行admは個別の入院を表します。注:idは患者の ID 番号、admDtsepDtはそれぞれ入院日と退院日を示します。複数回入院している患者さんもいます。

の各行はadmDx1 人の患者を表します。idは患者の ID 番号 ( で提供されているものと一致adm) であり、birthDtdxDtはそれぞれ患者の生年月日と診断日です。

私はいくつかの縦断的/時系列分析を行っており、診断前と診断後の異なる期間に患者が入院したかどうかを判断したいと考えています. 簡潔にするために、この質問は診断の前後 1 か月に関するものです。理想的には、私はしたいと思います:

  • 二値変数 (「はい」/「いいえ」) を作成し、特定の患者が期間中に入院したかどうかを示します (つまり、期間の開始前に入院したか退院したかは関係ありません)。期間のオフセット後)
  • 期間中に各患者が入院した回数を計算する
  • 期間中に各患者が入院していた期間 (日数) を計算します。

数日間にわたって多くの投稿を確認しました (例: R 期間の重複ID と重複する日付範囲によるデータフレームの結合R で 2 つの日付の間に発生したイベントを表示する方法); ただし、どれも私が興味を持っている3つの側面を組み合わせているようには見えません(重複する日付間の時間の計算、複数のデータフレーム、「グループ」[または個別]による)。

私は R を初めて使用し、ループやより高度な数式の経験がほとんどありません。パッケージからfoverlapslubridate、またはを使用できるようです。ただし、関連する式を作成する方法がわかりません。%overlaps%"DescTools"

どんな援助でも大歓迎です!

編集#1:

@sirallen の提案は、提供された例の特定の期間に有効でしたsum(pmin(dxDt, sepDt) - pmax(admDt, dxDt)), by = "id"が、実際のデータセットでは不正確な値が返されました (たとえば、1 日に複数回入院した患者 ["2000-01-25" - "2000-01-26"]伝えられるところによると、病院で過ごした日数はゼロです. コードは同様の例に答えるために使用されているように見えるので、これは私には奇妙に思えます.この問題は、これらの患者に対していくつかの重複する日付範囲があるという事実に関連していますか?さらに, @ によって指摘されたようにsirallen、コードは、患者が期間中に1回以上の入院をしたときに強調表示しませんでした.

以下のコードは、a) 患者が入院したかどうか、および b) 入院回数を判断することで、私の質問の最初の 2 つの部分へのより直接的なルートを提供しました。

ただし、pmin / pmax コードは引き続き機能せず、負の値が返されます。

編集#2

追加のケースをテストした後、問題 re: pmin / pmax は>vsの使用に関連している可能性があるようです>=:>を使用すると、正しいDur値が返されます。ただし、>=を使用するとDur、値 0 が返されます。

診断日までの日数を計算できるようにするには、このコードをどのように適用すればよいでしょうか?

0 投票する
1 に答える
16359 参照

r - 空間点のグリッドを作成する方法

補間する空間ドメインをロードする

R でクリギング メソッドを使用しようとしていますが、データのグリッドを見つけることができないために行き詰まっています。私のデータは米国のコロラド州全体を占めており、データをインターロープするためのグリッドを取得できるようにしたいと考えています。私がフォローしている例で使用されている meuse.grid に似ています。

どんな助けでもいただければ幸いです