0

以下のようなデータセットがあります。

 ID          Message     
  1                .
  2                .
  3     Click_screen
  4     Blank screen
  5                .
  6                .
  7                .

実際のデータセットには、48 列と 50,000 行があります。

このデータセットをread.table()でインポートすると、2 つの部分文字列の間にスペースがある文字列 "Blank screen" が原因で問題が発生します。たとえば、次のようなエラー メッセージが表示されました。

  Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
     line 4 did not have 48 elements

Excel で元のデータセットを変更するのではなく、R でこの問題を回避する方法はあるのでしょうか。

EDIT:追加するために、fillをTRUEに設定しようとしましたが、以下のエラーメッセージが表示されました:

 Error in read.table(file.choose(), header = T, fill = T) : 
   duplicate 'row.names' are not allowed
4

2 に答える 2

1

ローカルセパレーターに依存しますが、これを試してください

read.table(fileName,fill=TRUE,header=FALSE,sep =';')
于 2012-11-25T01:42:34.367 に答える
1

ファイルが (タブ区切りではなく) スペース区切りの場合、フィールド幅のベクトルと共に read.fwf が必要になることがあります。ファイルがタブ区切りの場合、read.table(sep='\t',...) が必要になる場合があります。

于 2012-11-25T01:47:11.940 に答える