私はいくつかの地理データを分析し、時間とその地理的位置に関してイベントの次の発生を予測/予測しようとしていました。データは次の順序でした(サンプルデータを含む)
タイムスタンプ緯度経度イベント 13307266102.8640097270.64039541「イベントA」 13311695102.808291270.47394645「イベントA」 13314940102.8224052270.6308513「イベントA」 13318949102.8340212870.64103035「イベントA」 13334397102.8472624270.66790352「イベントA」
最初のステップは、それを100のゾーンに分類することでした。これにより、ディメンションと複雑さが軽減されます。
タイムスタンプゾーン 13307266 47 13311695 65 13314940 51 13318949 46 13334397 26
次のステップは時系列分析を行うことでした。それから私はここで2か月間立ち往生し、たくさんの文献を読んで、これらが私の選択肢であると考えました* ARIMA(自己回帰法)*機械学習
機械学習を利用してPythonを使用して予測したかったのですが、実際にその方法を理解できませんでした。具体的には、ユースケースに固有のPythonライブラリ/オープンソースコードがあります。
編集1:明確にするために、データは過去のデータに大まかに依存していますが、一定期間にわたって均一に分散されています。データを視覚化する最良の方法は、グリッドからリソースを選択するタスクを割り当てるアルゴリズムによって制御されるN個のエージェントを想像することです。資源は社会の社会経済構造の機能であり、地理にも強く依存しています。需要ゾーンと時間を賢く予測できるようにするための「アルゴリズム」に関心があります。
ps:ARIMAのような自己回帰モデルの場合、Pythonにはすでにライブラリhttp://pypi.python.org/pypi/statsmodelsがあります。