「あなたの年齢を教えてください」という質問に対する答えであるベクトルがあります。
問題は、答えが文字列であることです。ですから、善良な人々の答えは、さまざまなクレイジーな形をとります。
いくつかの答えは「32」です。"32年"; "32 年"; 「もうすぐ70年」; 「古い、非常に古い…………40代半ば」; 「2013 年 10 月 7 日までに、私は 31 歳になりました」; "18歳"; などなど
これらのデータを可能な限り数値に変換し、残りを NA に変換する方法はありますか? (何千もの観測があるため、手動で行うことは望ましくありません)
ありがとう!