1

これに関連する質問の前に投稿しましたが、解決策は私の問題を完全には解決しませんでした.

文字「'」と「#」を含むテーブルがあり、read.table() を使用して読み取ると、それらの文字を含む行をスキップできません。

次のコマンドを使用してファイルを読み取っています。

table<- read.table("table.txt",header =TRUE, sep ="\t",quote="'",skip=8,fill=TRUE, comment.char="#",check.names=F)

これはテーブルの最初の列のみを読み取っており、本来のようにテーブル全体を読み取っていません。これを解決する方法はありますか? ここに画像の説明を入力

# を含むテーブルの行の例は次のとおりです。

Homo sapiens    Unigene Hs.549823   ILMN_110080 HS.549823   Hs.549823       Hs.549823       5053715 AI732602            ILMN_1846799    5910129 S   320 GCAGGTTGTTATTGTTGCTGAGCGGGGTGTGTGGGTGGCTAACGAGAGGG  11  +   61276241-61276290       zo26g12.x5 Stratagene colon (#937204) Homo sapiens cDNA clone IMAGE:588070 3, mRNA sequence
4

1 に答える 1

2

代わりに使用readLines()して生の行を取得し、区切り文字に従ってスプライスしてみてください

library(stringr)

# Open Connection to file
pathToFile <- path.expand("~/path/to/file/myfile.txt")
f <- file(pathToFile, "rb")  

# Read in lines
rawText <- readLines(f)

problemFreeTable <- 
  sapply(rawText, str_split, "\t")  # replace "\t" with "," or the appropriate delim. 
于 2012-11-13T05:21:36.673 に答える