0

次の構造の統計出力ファイルが提供されています。

> dput(x)
structure(list(V1 = c(0.236364, 0.032086, 0.062762, 0.095238, 
NaN, 0, 1, 2, 3, 4, 0.258706, 0.436735, 0.104167, 0.611336, 0.160279
), V2 = c(0.183333, 0.623333, 0.796667, 0.14, 0, NA, NA, NA, 
NA, NA, 0.67, 0.816667, 0.96, 0.823333, 0.956667), V3 = c(NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA)), .Names = c("V1", 
"V2", "V3"), class = "data.frame", row.names = c(NA, -15L)) 

データを読むためのリンク: https://docs.google.com/file/d/0BxSZDr4eTnb9aDhCOGRxVEV5aVE/edit?usp=sharing

データ プロパティ:

  • ヘッダーなし

  • ファイルは特定の区切り文字オ​​プションを使用します
    numeric[space][tab][space]numeric[space][tab][space] # 2 つの数値列コンポーネント

  • 行番号は明らかに異なる場合がありますが、コンポーネント 2 と 3 では常に同じです。


各コンポーネントの data.frames に分割する必要があります:
1 コンポーネント - 最初の 2 列セクション
2 コンポーネント - 1 列セクション
3 コンポーネント - 2 番目の 2 列セクション

同様のデータ ファイルを 3 つのコンポーネントに分割する一般的な方法が見つかりません。

分割オブジェクトとしてさまざまな区切り記号を使用する例を見つけましたが、列番号と区切り記号オプションのこの特定のケースではありません。

例が十分かどうか教えてください。delimiter オプションがこの特定の問題にどの程度関連するかはわかりません。そうではないと思います。

4

2 に答える 2

1

3 文字の区切り記号を 1 文字の区切り記号に変換することから始めていただけますか?

コマンドラインで試すことができます:

cat input.txt | sed 's/ \t /\t/g' > input2.txt

これにより、すべての「\t」が「\t」に置き換えられます

または、お気に入りのtxtエディターで開いて、すべてを検索/置換することもできます

区切り文字が標準形式になると、その後の処理がはるかに簡単になります

于 2013-03-22T19:35:49.347 に答える