27

最初の行がヘッダーであるファイルがあります。ヘッダーにはスペースと#記号を含めることができます(他の特殊文字も含まれる場合があります)。read.csvまたはread.tableを使用してこのファイルを読み込もうとしていますが、エラーが発生し続けます。

undefined columns selected 

more columns than column names 

タブ区切りのchromFileファイルは次のようになります。

Chromosome# Chr chr Size    UCSC NCBI36/hg18    NCBIBuild36 NCBIBuild37
1   Chr1    chr1    247199719   247249719   247249719   249250621
2   Chr2    chr2    242751149   242951149   242951149   243199373

指示:

chromosomes <- read.csv(chromFile, sep="\t",skip =0, header = TRUE,  )

まず、スペースや#を他の読み取り可能な記号に置き換えずに、ファイルをそのまま読み取る方法を探します。

4

1 に答える 1

51

ドキュメントから ( ?read.csv):

comment.char文字: 単一の文字または空の文字列を含む長さ 1 の文字ベクトル。"" を使用して、コメントの解釈を完全にオフにします。

デフォルトはcomment.char = "#"、問題を引き起こしているものです。ドキュメントに従って、 を使用する必要がありますcomment.char = ""

ヘッダーのスペースは、mrdwab が親切に指摘したように、設定することで対処できる別の問題ですcheck.names = FALSE

chromosomes <- read.csv(chromFile, sep = "\t", skip = 0, header = TRUE,
                        comment.char = "", check.names = FALSE)
于 2012-10-07T18:26:27.160 に答える