多くの欠損値を含む .csv データセットがあり、テーブルを読み込むときに R にそれらをすべて同じ方法 (「正しい」方法) で認識させたいと思います。私は以下を使用しています:
import = read.csv("/Users/dataset.csv",
header =T, na.strings=c(""))
このスクリプトはすべての空のセルを何かで埋めますが、一貫性がありません。データを で見るとhead(import)
、欠落しているセルが で埋められ、<NA>
欠落しているセルが で埋められていNA
ます。データセットの分析を開始するときに R が欠損値を識別するこれら 2 つの方法を異なる方法で扱うのではないかと心配しているため、これらの欠損値をインポートに一様に読み込ませたいと考えています。
最後に、私の csv ファイルの一部の欠損値は、ピリオドのみで表されます。また、R にインポートするときに、これらの期間が正しい欠損値表記で表されるようにしたいと考えています。