2

国のパーティション (~郡) を表す ~36,000 のポリゴンのセットがあります。私の python スクリプトは、pointId、経度、緯度など、多くのポイントを受け取ります。

ポイントごとに、pointId、polygonId を送り返したいです。ポイントごとに、すべてのポリゴンにループして myPoint.within(myPolygon) を使用するのは非常に非効率的です。

shapely ライブラリは、ポイントのポリゴンを見つけることがツリー パス (国、地域、サブ地域など) になるようにポリゴンを準備するためのより良い方法を提供すると思います。

これまでの私のコードは次のとおりです。

import sys
import os
import json
import time
import string
import uuid

py_id = str(uuid.uuid4())

sys.stderr.write(py_id + '\n')
sys.stderr.write('point_in_polygon.py V131130a.\n')
sys.stderr.flush()

from shapely.geometry import Point
from shapely.geometry import Polygon
import sys
import json
import string
import uuid
import time

jsonpath='.\cantons.json'
jsonfile = json.loads(open(jsonpath).read())

def find(id, obj):
    results = []

    def _find_values(id, obj):
        try:
            for key, value in obj.iteritems():
                if key == id:
                    results.append(value)
                elif not isinstance(value, basestring):
                    _find_values(id, value)
        except AttributeError:
            pass

        try:
            for item in obj:
                if not isinstance(item, basestring):
                    _find_values(id, item)
        except TypeError:
            pass

    if not isinstance(obj, basestring):
        _find_values(id, obj)
    return results


#1-Load polygons from json  
r=find('rings',jsonfile)
len_r = len(r)

#2-Load attributes from json
a=find('attributes',jsonfile)

def insidePolygon(point,json):
        x=0
    while x < len_r :
            y=0
            while y < len(r[x]) :
        p=Polygon(r[x][y])
        if(point.within(p)):
            return a[y]['OBJECTID'],a[y]['NAME_5']
        y=y+1
        x=x+1
    return None,None


while True:
    line = sys.stdin.readline()
    if not line:
        break
    try:
        args, tobedropped = string.split(line, "\n", 2)

        #input: vehicleId, longitude, latitude
        vehicleId, longitude, latitude = string.split(args, "\t")

        point = Point(float(longitude), float(latitude))
        cantonId,cantonName = insidePolygon(point,r)

        #output: vehicleId, cantonId, cantonName
        # vehicleId will be 0 if not found
        # vehicleId will be < 0 in case of an exception
        if (cantonId == None):
            print "\t".join(["0", "", ""])
        else:
            print "\t".join([str(vehicleId), str(cantonId), str(cantonName)])

    except ValueError:
        print "\t".join(["-1", "", ""])
        sys.stderr.write(py_id + '\n')
        sys.stderr.write('ValueError in Python script\n')
        sys.stderr.write(line)
        sys.stderr.flush()
    except:
        sys.stderr.write(py_id + '\n')
        sys.stderr.write('Exception in Python script\n')
        sys.stderr.write(str(sys.exc_info()[0]) + '\n')
        sys.stderr.flush()
        print "\t".join(["-2", "", ""])
4

2 に答える 2

7

Rtree ( examples ) をR ツリー インデックスとして使用して、(1) 36k ポリゴンの境界にインデックスを付けます (jsonfile を読み取った直後にこれを行います)。次に、(2) 各ポリゴンの交差する境界ボックスを関心のあるポイントに非常に迅速に見つけます。 . 次に、(3) Rtree からの交差するバウンディング ボックスについては、シェイプリーを使用して使用します。たとえばpoint.within(p)、実際のポイント イン ポリゴン分析を行います。この手法を使用すると、パフォーマンスが大幅に向上するはずです。

于 2013-11-30T08:33:15.920 に答える
4

それは素晴らしい、

サンプルコードは次のとおりです。

polygons_sf = shapefile.Reader("<shapefile>")
polygon_shapes = polygons_sf.shapes()
polygon_points = [q.points for q in polygon_shapes ]
polygons = [Polygon(q) for q in polygon_points]
idx = index.Index()
count = -1
for q in polygon_shapes:
    count +=1
    idx.insert(count, q.bbox)
[...]
for j in idx.intersection([point.x, point.y]):
    if(point.within(polygons[j])):
        geo1, geo2 = polygons_sf.record(j)[0], polygons_sf.record(j)[13]
        break

ありがとう

于 2014-01-20T14:58:10.517 に答える