2

非常に大きなサイズの gtfs zip ファイルがある場合があります。有効期間は 6 か月ですが、このような大きなデータ サイズを低リソース (たとえば、2 ギガのメモリと 10 ギガのハードディスク) EC2 にロードするには経済的ではありません。サーバ。

この大きなサイズの gtfs を 3 つの小さな gtfs zip ファイルに分割して、2 か月 (6 か月/3 ファイル) 分の有効なデータを保持できるようにしたいと考えています。つまり、2 か月ごとにデータを置き換える必要があるということです。

反対の目標 MERGE を達成する Python プログラムを見つけましたhttps://github.com/google/transitfeed/blob/master/merge.py (これは非常に優れた Python プロジェクトです)。

私はどんなポインタにもとても感謝しています。

よろしくお願いします、

ダン。

4

2 に答える 2

2

GTFS フィードの読み込みに関しては、通常、stop_times.txt のエントリが最大のメモリ消費量になることに注意してください。ほとんどのシステムは、トリップがアクティブな日付の trips+stop_times を複製しないため、サービス カレンダーを減らしてもあまり節約にはなりません。

とはいえ、GTFS をスライスおよびダイシングするためのツールがいくつかあります。たとえば、OneBusAway GTFS Transformer ツールを確認してください。

http://developer.onebusaway.org/modules/onebusaway-gtfs-modules/1.3.3/onebusaway-gtfs-transformer-cli.html

于 2014-11-12T18:47:20.337 に答える