問題タブ [rdata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rdata: データ フレームの行に dist() を適用する
私がすることができます:
そして距離をとります。しかしdata
、そこには1000行以上あり、GPとポイントに基づいて各行に最も類似した10個のレコードが必要ですが、よくわかりません。
何かのようなもの:
しかし、明らかにそれは機能していません。ここで簡単な修正はありますか?
サンプルデータ:
r - カスタム関数を使用して R plyr & dplyr に適応 (および変更?)
次のようなカスタム関数があります。
のようにデータフレームに適用されplyr
ます...
dplyr
これをusing (推測)に移行する方法がわかりませんmutate()
。データフレームの現在の行を渡すにはどうすればよいですか? 私はこれを試しました..
しかし、エラーはcase
決して渡されないということです...完全に混乱しています。
r - アクセス許可が拒否されたときにRオブジェクトをディスクに保存する方法は?
多くの時間がかかる R オブジェクトを計算しました。しかし、を使用してファイルに保存しているときにwrite.csv
、次のようなエラーが発生します
また、このオブジェクトを.rda
ファイルに保存しようとしただけでなく、ワークスペース イメージ全体をファイルに保存しようとしまし.RData
たが、それでもpermission denied
エラーが発生しました。root アクセスで R を実行し、全体を再計算する代わりに、このオブジェクトを何らかの方法でディスクに保存する方法はありますか? ................................................................... ................................................................... .........
アップデート :
に取り組んでいUbuntu 12.04
ます。次の方法でRオブジェクトを保存しようとしました:
................................................................... ................................................................... .........
答え :
コマンドfile_name.csv
を使用して、同じ名前 (たとえば )のファイルを作成しました。touch
コマンドを使用してアクセス許可を変更しchown
、自分が所有するようにしました(ルートユーザーではありません)。次に、オプションを指定してwrite.table
コマンドを使用append=TRUE
して、新しく作成されたファイルにデータフレームを書き込んだところ、期待どおりに機能しました。
r - RData を Shiny にロード - データは R ワークスペースにロードされましたが、Shiny にはロードされず、エラーは発生しませんでした
目的:アプリにアップロードしたデータ セット (.RData
形式) をダウンロードし、そのデータ セットをさまざまなプロット目的に使用します。GitHub
Shiny
手法:source_data
パッケージの関数を使用してrepmis
、データを R セッションに読み込みます。このロードはglobal.R
ファイルで行われるため、ロードされたデータはファイル内のプロット関数で使用できると確信していましたserver.R
。
問題:global.R
すべての関数を関数server.R
の直前に移動すると、データが R ワークスペースに読み込まれshinyServer()
ます。
ただし、アプリで使用できるデータはなく、エラーも発生しません。プロットしたり、 を使用して検査したりすることはできません。Shiny
dim()
類似の質問:類似の質問がここにありますが、ここから何の助けも得られませんでした - いずれにしても、またはGlobal.R
ではなく にデータをロードしています。
別の質問はこちらですが、ユーザーはリアクティブ ソースにデータを読み込みます。私のデータは変更されないので、ファイルにロードしています。 server.R
ui.R
global.R
Global.R
サーバー.R
Ui.R
sql-server - RData は、データベースを再度クエリするよりも読み込みに時間がかかります
256GB RAM サーバーで RStudio Server を実行し、別のサーバーで MS-SQL-Server 2012 を実行しています。この DB には、最大 1 億のノードと最大 1 億 5000 万のエッジを持つグラフを作成できるデータが含まれています。
そのデータからこのグラフを作成するのにかかる時間を計りました。
- 最初の SELECT クエリ = ~22M 行 = 12 分 = df1 (dataframe1)
- 2 番目の SELECT クエリ = ~30M 行 = 8 分 = df2
- 3 番目の SELECT クエリ = ~32M 行 = 8 分 = df3
- 4 番目の SELECT クエリ = ~63M 行 = 70 分 = df4
edges = rbind(df1, df2, df3, df4)
= 6 分mygraph = graph.data.frame(edges)
= 30 分
それで2時間ちょっと。私のデータは非常に安定しているので、mygraph
ディスクに保存することで処理を高速化できると考えました。しかし、ロードしようとすると、ロードされませんでした。何かがおかしいと思って、4時間待った後、あきらめました。
そのため、サーバーを再起動し、.rstudio フォルダーを削除して最初からやり直します。今回は、各 SQL クエリのデータフレームとデータフレームを、edges
RData と RDS の両方の形式 (毎回)save()
で保存します。保存するたびに、5 つのデータフレームの時間を計りました。とがほぼ同じ時間:saveRDS()
compress = FALSE
load()
readRDS()
load()
readRDS()
- df1 = 1.1 GB ファイル = 1 分
- df2 = 1.4 GB ファイル = 2 分
- df3 = 1.7 GB ファイル = 6 分
- df4 = 3.1 GB ファイル = 13 分
- エッジ = 6.8 GB ファイル = 21 分
十分だ、と私は思った。しかし、今日、新しいセッションを開始しload(df1)
て変更を加えようとしたとき、また何かがおかしいと感じました。ロードされるのを20分待った後、あきらめました。このサーバーを使用しているのは私だけなので、メモリ、ディスク、CPU が問題になることはありません。既にサーバーを再起動し、.rstudio フォルダーを削除しました。何かがセッションをハングさせているのではないかと考えていますが、データフレームはまだ読み込まれません。load()
おそらく実行中ですがiotop
、ディスクアクティビティは表示されません。これは私が得たものですps
ps -C rsession -o %cpu,%mem,cmd
%CPU %MEM CMD
99.5 0.3 /usr/lib/rstudio-server/bin/rsession -u myusername
次に何を試せばいいのかわからない。RData ファイルの読み込みに、別のサーバーにある SQL データベースのクエリよりも時間がかかるというのは、私には理解できません。たとえそうだったとしても、データフレームを保存した後のタイミングload()
と時間で、なぜそんなに速かったのですか?readRDS()
ここ StackOverflow で質問するのは初めてなので、この質問に答えるために重要なことを言い忘れていたら申し訳ありません。もしそうなら、私に知らせてください。
編集:コメントでブランドンが要求した追加情報。OS は CentOS 7 です。データフレームには、最初の 2 列 (col1=node1; col2=node2) にエッジのリストと、エッジ属性用の追加の 2 つの列が含まれています。すべての列は文字列で、長さは 5 ~ 14 文字です。また、各データフレームのおおよその行数を元の投稿に追加しました。ありがとう!
r - .Rdata モードの R で .first() 関数を使用する方法
R セットアップをカスタマイズしようとしています。関数 (.First/Last) をRprofile.site
orに入れることができる部分を理解しました.Rprofile
。.Rdata
しかし、私はルートを取りたいです。私が理解しているように、作業ディレクトリの.Rファイルのいずれかに.First/.Last関数がある場合。次に、.Rdata
ファイルを開くと、カスタム設定が読み込まれます。
セッションを終了すると Adios が表示されますが、.Rdata
. とにかく、以下は私の .First と .Last 関数です。