予測できない文字セットの文字列を、予想される列数で表にしています。適切なセパレーターを選択するのに苦労しています。
たとえば、サンプル テーブルは次のようになります。
ファイル名: foo.txt
セパレーター: "\u00AA"
ROW1、COL1: フー
ROW1、COL2: b、ar
ROW1、COL3: fo;obar
ROW1、COL4: bo\tt
そして。
RIで与えるだろう
read.table('foo.txt', sep="\u00AA")
そして得る
無効な 'sep' 値: 1 バイトでなければなりません
予測できない文字列との競合を避けるために、どのセパレーターを使用すればよいですか? Unicode は \u007F まで受け入れられますが、R はそれ以上のものをマルチバイトとして解釈します。なんで?