1

R に読み込みたいタブ区切りの DAT ファイルがread.delimあります。

私のデータファイルは調査への回答を表しています。もう少し深く掘り下げた後、「。」がある場合、Rは新しいレコードを作成しているように見えます。自由回答を表す列に。回答者が「Enter」を押して新しい行を追加した可能性がある場合があるようです。

これを回避する方法はありますか?ヘルプを読みましたが、文字応答でこの文字を無視するように R に指示する方法がわかりません。

正しく解析されない応答の例を次に示します。これは 1 つの応答ですが、R で解析すると複数行に渡って返されることがわかります。

possible ask for size before giving free tshirt.
 Also maybe have the interview in conference rooms instead of tight offices. I felt very cramped.
 I would of loved to have gone, but just had to make a choices and had more options then I expected.

私はSPSSでデータを分析しており、データはうまく取り込まれましたが、より高度なモデリングにはRを使用する必要があります

どんな助けでも大歓迎です。前もって感謝します。

4

1 に答える 1

3

「na.strings」引数があります。テストケースは提供していませんが、おそらくこれを行うことができます:

read.delim(file="myfil.DAT", na.strings=".")

問題をよりよく示すように、質問を編集していただければ幸いです。簡単な努力でエラーを作成することはできません:

> read.delim(text="a\tb\t.\nc\td\te\n",header=FALSE)
  V1 V2 V3
1  a  b  .
2  c  d  e
> read.delim(text="a\tb\t.\nc\td\te\n",header=FALSE, na.strings=".")
  V1 V2   V3
1  a  b <NA>
2  c  d    e

(上記のコメントは特に関連性がないことを明確にした後。)これにより、改行が含まれるフィールドが取り込まれます....ただし、元のファイルで「フィールド」を引用する必要があります。

> scan(file=textConnection("'a\nb'\nx\t.\nc\td\te\n"), what=list("","","") )
Read 2 records
[[1]]
[1] "a\nb" "c"   

[[2]]
[1] "x" "d"

[[3]]
[1] "." "e"
于 2012-08-01T16:35:32.540 に答える