問題タブ [readxl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - readxl パッケージのインストールに関する問題
readxl
新しいパッケージを Windows 64 ビット マシンにインストールしようとしています。インストールのために次のコマンドを試しました
install_github
コマンドで次のエラーが発生します。
誰かがこのエラーを手伝ってくれますか?
r - パッケージ readxl を使用して xlsx データを R にインポートする際の列タイプの指定
xlsx
2007 のテーブルを下のR 3.2.1patched
パッケージを使用してインポートしています。テーブルのサイズは、25,000 行 x 200 列のオーダーです。readxl 0.1.0
Windows 7 64
機能read_excel()
は扱います。私の唯一の問題は、列クラス (データ型) をまばらに入力された列に割り当てることです。たとえば、特定の列が 20,000 行に対して NA である場合、行 20,001 で文字値を取ります。read_excel()
列の最初の n 行をスキャンして検索する場合のみ、列の型が数値にデフォルト設定されているように見えますNAs
。問題の原因となっているデータは、数値が割り当てられた列の文字です。エラー制限に達すると、実行が停止します。実際にはスパース列のデータが必要なので、エラー制限を高く設定しても解決策にはなりません。
スローされた警告を確認することで、問題のある列を特定できます。パッケージのドキュメントに従って引数を設定することにより、read_excel()
列のデータ型をアサートするオプションがあります。col_types
スプレッドシートから推測するか、 、、またはNULL
を含む文字ベクトルから推測します。blank
numeric
date
text
しかし、これは長さ 200 のベクトルを構成し、問題のある列に対応するいくつかの位置blank
とほぼすべての位置に配置する必要があるということでしょうか?text
おそらく、数行のR
コードでこれを行う方法があります。必要な長さのベクトルを作成し、blank
s で埋めます。おそらく、強制される列の数を含む別のベクトル、そして...または、その推測が期待どおりではない列だけtext
を呼び出すことができるかもしれません。read_excel()
提案をいただければ幸いです。
前もって感謝します。
r - readxl と正しい変数型を使用して複数の Excel スプレッドシートを R に読み込む
パッケージを使用して R に読み込もうとしているいくつかの Excel ファイルがありますreadxl
。Excel ファイルは、変数の 4 つの列を持つ 60000 行の各タブで構成されています。最初の列は、0、1、2 などの秒を追跡するための単純な整数カウントです。2 番目の列は:
、HH:MM:SS でコロン ( ) で区切られた時間です。/
3 番目の列は、 MM/DD/YYYY としてスラッシュで区切られた ( ) 日付です。4 番目の列は浮動小数点数 (338.6 など) です。
次のコードを使用すると、4 つの列が得られ、一部の書式は一貫していますが、一部のデータは、整数、時刻、または日付ではなく、日付または 10 進数として誤って解釈されているように見えます。
またcol_types
、列の型を定義するために使用しようとしましたが、これは NA でいっぱいのデータ フレームを返します。
lapply()
withを使用するとread_excel()
、データ フレームのリストが返されます。変数の型を変更しようとする必要があるかどうか、またはこれを正確に行う方法がわかりません。Excel ファイル自体は、変数の型に関して一貫しているように見えます。data1[[2]]
X2 の 363.0 を示す 59998行も確認しましたが、03:42:51 である必要があります。
これらのデータを Excel でフォーマットするか、R で変更する必要がありますか? 現在、すべてがクラスのキャラクターのようです。Rで変数の型を変更する最も効果的な方法は何ですか?
ご協力いただきありがとうございます。
r - RStudio read.xl 作業ディレクトリ エラー
こんにちは皆さん、.xlsx を RStudio に読み込むのに問題があります。RStudio がファイルを表示できない理由がわかりません。read_excel() のパスを間違って指定していませんか? 何か案は?Rでかなり新しい.
ありがとう!
Windows 10 (64 ビット) バージョン 0.99.491 & バージョン 0.99.840 read.xl 0.1.0
getwd()
[1] "C:/Users/user/Documents/Work"
read_excel(system.file("C:/Users/user/Documents/Work/Data.xlsx"))
Error: '' does not exist in current working directory ('C:/Users/user/Documents/Work')
r - read_excel () と lapply()
ファイルに 2 つのシートがあり、from package.xlsx
を使用して両方の Excel シートのリストを生成したいと考えています。このコードを使用しましたread_excel
readxl
このread_excel()
関数は"data.xlsx"
ファイルに対して複数回呼び出され、各シートが次々に読み込まれます。結果はデータ フレームのリストで、各データ フレームは のシートの 1 つを表しdata.xlsx
ます。lapply
私の質問は、ファイルが既に作業ディレクトリにあるのに、なぜ関数にパス引数を書く必要があるのですか?
r - R readxl read_excel() および 1900 年 1 月 1 日 0:00
パッケージから使用read_excel()
してreadxl
、日付の列を持つスプレッドシートを読み取ると、検査時に多数の「1899-12-31 00:00:00 UTC」が表示されます。これらは、Excel 内から見た "1/1/1900 0:00" に対応しています。
この一見 1 日分の違いを気にする必要がありますか? そして、この日付が「1900-01-01 00:00:00 UTC」として R に表示されないのはなぜですか?
他の日付との差異は見られません。たとえば、Excel の「2/22/2008 11:10」は、R では「2008-02-22 11:10:55 UTC」となります。
r - RでExcelシートのタブ名を読み取る方法は?
Excelファイルをすべてのタブ名とともにRにロードするにはどうすればよいですか? readxl
現在 Excel を読むためにパッケージを使用していますが、タブ名を保存する方法がわかりません。例えば、
ここでシート番号を指定しました。1 は R によって読み取られますが、その名前も取得する方法は?
r - read_excel を使用して R の Excel ファイルから限られた数の行を読み取る
次のような readxl パッケージを使用して、R で Excel ファイルを読み込んでいます。
多くのExcelファイルがあるため、最初の100行のみが必要です。明らかに、これは効率的ではありません。このファイル全体を読み取ってサブセット化するのではなく、最初に Excel から 100 行のみを読み取る方法はありますか?