地理的な場所の名前と座標が同時に欠落している一連のデータセットがあります。データの将来の分析を進めることができるように、ギャップを埋めたいと思います。データセットはtwitterから収集したものなので作成したデータではありませんが、このようにデータが入ってきたので、どうにかしてギャップを埋めて、今後の分析を続ける必要があります.
オプション 1: と のいずれかを使用userLocation
しuserTimezone
てcoordinates
入力:
userLocation, userTimezone, Coordinates,
India, Hawaii, {u'type': u'Point', u'coordinates': [73.8567, 18.5203]}
California, USA
, New Delhi,
Ft. Sam Houston,Mountain Time (US & Canada),{u'type': u'Point', u'coordinates': [86.99643, 23.68088]}
Kathmandu,Nepal, Kathmandu, {u'type': u'Point', u'coordinates': [85.3248024, 27.69765658]}
期待される出力
userLocation, userTimezone, Coordinates_one, Coordinates_two
India, Hawaii, 73.8567, 18.5203
California, USA, [fill this] [fill this]
[Fill this], New Delhi, [fill this] [fill this]
Ft. Sam Houston,Mountain Time (US & Canada), 86.99643, 23.68088
Kathmandu, Kathmandu, 85.3248024, 27.69765658
Python または pandas でスクリプトを記述して、欠落している場所の名前と座標を同時に入力し、出力を適切にフォーマットすることは可能ですか?
Python または Pandas には魔法のパッケージがないことは理解していますが、何かを始めると役に立ちます。
GISセクションでこの質問をしましたが、あまり役に立ちません。地理位置情報データ セットを使用するのはこれが初めてで、どのように開始すればよいかわかりません。質問が適切でない場合は、反対票を投じるのではなく、コメントして削除してください。