問題タブ [read.table]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - read.tableを使用してRに行がドロップされていますか?
最初の列がURLであるテーブルをロードし、を使用してRに読み込みますread.table()
。
Rは列の約1/3をドロップしているようで、エラーは返されません。
URLに#
文字やタブ(区切り文字フィールド)が含まれていないため、問題になる可能性があると理解しています。最初にURLを整数IDに変換すると、問題は解決します。
Rが行をドロップする原因となる可能性のあるフィールドについて何かありますか?
r - read.table を使用したテキスト ファイルの読み取り
id
and列を含むテキスト ファイルがあり、name
それを R のデータ フレームに読み込もうとしています。
しかし、何らかの理由で、多くの行がマージされます。たとえば、データ フレームの行 500 では、次のようになります。
[つまり、元のテキスト ファイルが 5000 行ある場合、テーブルのサイズは 1000 行 2 列になります。]
私はこれを何度も経験しました。誰が問題が何であるか、またはそれを修正する方法を知っていますか?
r - ファイルから選択した列のみをRに読み取る方法はありますか?(`read.table`と`scan`の間の幸せな媒体?)
非常に大きな区切りデータファイルがいくつかあり、ファイル全体のを作成するための時間とメモリを使わずに、Rの特定の列のみを処理したいと考えています。data.frame
私が知っている唯一のオプションはread.table
、2、3列だけが必要な場合に非常に無駄になるか、必要scan
なものに対してレベルが低すぎるように見えるかです。
純粋なRを使用するか、他のシェルスクリプトを呼び出して列抽出を実行し、その出力でscanまたはread.tableを使用する、より良いオプションはありますか?(シェルスクリプトを呼び出して、その出力をRでキャプチャする方法についての質問につながるのはどれですか?)
r - 複数の.txtファイルをRにどのように読み込みますか?
Rを使用して、すべて.txt形式のデータを視覚化しています。ディレクトリには数百のファイルがあり、すべてを1つのテーブルに一度にロードしたいと思います。
何か助けはありますか?
編集:
ファイルの一覧表示は問題ありません。しかし、リストからコンテンツに移動するのに問題があります。ここからいくつかのコードを試しましたが、この部分にバグがあります。
言って
この問題を明確にするコードスニペットをいただければ幸いです。
r - read.table 使用時の R データ読み込みの進行状況の監視
他のタイプのデータ読み込みについては多くの回答が見つかりましたが、R がread.table(...)
. 簡単なコマンドがあります:
これにより、約 30 秒ほどで大量のデータが読み込まれますが、プログレス バーがあれば非常に便利です :-D
r - Rを使用してタブdelimファイルを単一のファイルに結合する
次のように、各ファイルに 3 列の txt ファイルがいくつかあります: ファイル 1:
ファイル 2:
ファイル 3:
上記のすべてのファイルで、ProbeID 列の値は同じですが、他の列は同じではありません。次に、for ループを使用して上記のすべてのファイルを次のような 1 つのファイルに結合します。
私を助けてください。
r - read.delim()-エラー「列名よりも多くの列」と「ヘッダーと「col.names」の長さが異なります」
予備情報 OS:WindowsXPProfessionalバージョン2002ServicePack 3; Rバージョン:R 2.12.2(2011-02-25)
関数を使用して、30,000行×80列のタブ区切りのテキストファイルをRに読み込もうとしていread.delim()
ます。このファイルには、「_」という命名規則の列ヘッダーがあります。データを読み込もうとするために使用するコードは次のとおりです。
このコマンドを送信すると、次のエラーメッセージが表示されます。
重要な情報-列8から列80まで、各列のゼロの数は次のとおりです。
上記のエラーメッセージを受け取った理由を特定するのを手伝ってもらえますか?どんな助けでも大歓迎です。
r - 列名には、スペースが必要な場所にピリオドが挿入されています
ggplot によって生成されたプロットでは、x 軸に沿った各ラベルは文字列、つまり「1990 年の製品」です。ただし、生成されたプロットでは、各単語の間にピリオドがあります。つまり、上記の文字列は「the.product.in.1990」と表示されます</p>
上記の「。」を確認するにはどうすればよいですか。追加されていませんか?
次のコードは、x 軸に沿った各ポイントに文字列を追加するために使用したものです。
サンプルコード:
の各行ddata$labels$text
は、「1990 年の製品」のような文字列です。「the.product.in.1990」ではなく、生成されたプロットで同じ形式を維持したい
r - read.fwfと番号記号
次のリンクで説明されているように、固定幅の構造を使用してこのファイル(3.8MB)を読み取ろうとしています。
このコマンド:
エラーが発生します:
37行目には10個の要素がありませんでした
スキップオプションの値を変えて問題を再現した後、問題の原因となっている行にはすべて「#」記号が含まれていることがわかりました。
それを回避する方法はありますか?
r - read.table で列数を指定できますか?
別の分析プログラムから生成されたファイルの読み込みを自動化しようとしています。
標準出力は通常、スペースで区切られた 6 列で、最後にキャリッジ リターンがあります。これは、「read.table」で「strip.white = TRUE」を使用するだけでうまく読み込まれます。
問題がありますが、パラメータが定数として固定されている場合、b/c 行に注釈が追加されます。
「flush = TRUE」を追加すると、これらの時折のコメントをスキップして、すべてを読むことができます。
私がやりたいのは、特定のファイルで 1 回だけ発生する可能性があるこれらのコメントを 7 番目の列として追加することです。
列の数を指定したり、この 7 番目の列に対応する他の方法を指定できる読み込み方法はありますか?
データのスニペットはここにあります
データは次のようになります。