Readr は素晴らしいパッケージです。しかし、人々は各列のデータ型を指定するのが面倒です。(たとえば、30のうち)。
解析の失敗を調べると、1 つの列だけが重要な問題であることが明らかになる場合があります。
以下を参照してください
fname='c:/q/net/SnomedCT_RF2Release_INT_20160131/Full/Terminology/sct2_Concept_Full_INT_20160131.txt'
> snm<-read_delim(fname,delim='\t')
Warning: 4016 parsing failures.
row col expected actual
528950 id an integer 11000119105
528951 id an integer 11000119105
528952 id an integer 41000119109
528953 id an integer 61000119108
528954 id an integer 81000119104
...... ... .......... ...........
.See problems(...) for more details.
> probs<-problems(snm)
> table(probs$col)
id
4016
>
データセット内の 1 つの列 (私の場合は列 ID) のデータ型を指定するにはどうすればよいですか。(キャラになる)
names(snm)
[1] "id" "effectiveTime" "active" "moduleId" "definitionStatusId"