特定のエンコーディングを使用して、.tsv(タブ区切り値)ファイルをRに読み込もうとしています。おそらくwindows-1252
です。そして、それはヘッダーを持っています。
コードをデータフレームに入れるための提案はありますか?
おそらくこのようなものですか?
mydf <- read.table('thefile.txt', header=TRUE, sep="\t", fileEncoding="windows-1252")
str(mydf)
次のものも使用できます。
read.delim('thefile.txt', header= T, fileEncoding= "windows-1252")
Rコンソールにコマンドを入力するだけです。
> read.delim
function (file, header = TRUE, sep = "\t", quote = "\"", dec = ".",
fill = TRUE, comment.char = "", ...)
read.table(file = file, header = header, sep = sep, quote = quote,
dec = dec, fill = fill, comment.char = comment.char, ...)
これは、データの区切り文字としてタブをすでに指定してread.delim
いるパッケージ化されたコマンドであることを示しています。多数のtsvファイルを使用している場合は、より便利な場合があります。read.table
read.delim
2つのコマンドの違いについては、このスタックの質問で詳しく説明します。
df <- read.delim(~/file_directory/file_name.tsv, header = TRUE)
.tsv
すでにタブで区切られているため、単一のファイルでは正常に機能します。そのため、必要はありませんsep = "\t"
。fileEncoding= "windows-1252"
使用できますが、必須ではありません。