1

背景: 私は気象サービスを作成したいと考えています。ほとんどの利用可能な API では 1 日の呼び出し数が制限されているため、地球を 1000 ほどの地域に分割したいと考えています。

明らかに、インターネット ユーザーは一様に分布しているわけではないため、人口密度の高い地域ではサンプリングをより細かくする必要があります。

これを実装するにはどうすればよいですか?

  • 地理的なインターネット ユーザー密度に関するデータはどこで確認できますか?
  • アルゴリズムは、おそらく k-means に似たものになります。ただし、海のある球体に実装するのは少し難しいかもしれません。洞察はありますか?
  • 最後に、これをすべて回避できる方法はありますか?
4

2 に答える 2

1

k-mean に非常によく似ているのは、重心ボロノイ図です (k-means の連続バージョンです)。ただし、これにより、希望どおりにユーザー密度を考慮しない、球体の均一なテッセレーションが生成されます。

したがって、同様のソリューションは同じ手法ですが、パワー ダイアグラムで使用されます。パワー ダイアグラムは、(各ボロノイ シードに重みを割り当てることによって) 密度を説明するボロノイ ダイアグラムです。このようなダイアグラムは、最初の 2 つの (x,y) 座標と [任意の大きな正の定数から与えられた重みを引いた値の平方根である 3 番目の座標で構成される 3D 空間 (2D ではなく) への埋め込みを使用して計算できます。点]。

それを使用して、ユーザー密度を説明するドメインのテッセレーションを取得できます。

于 2013-03-31T22:31:03.433 に答える
0

一般的に、インターネット ユーザーの密度は気にしません。サービスを使用しているユーザーの密度に関心があります。それらのユーザーがどこにいるかは気にしません。したがって、サイトが 1 日以上稼働している場合は、前日に人々が尋ねた場所を使用して、翌日のエリアを決定することができます。

ツリーでの動的プログラミングは簡単です。私がアルゴリズムのために行うことは、連続してより細かく分割されたセルのツリーを構築することです。セルが多いほど誤差が小さいことを意味します。これは、人々はより近い点の予測を取得し、誤差、または少なくともセルの数が多い場合と少ない場合の相対誤差を計算できるためです。ボトムアップから始めて、各サブツリーが寄与する可能性のある最小の合計エラーを計算し、最大 1、2、3、..N に分割できるようにします。方法。ノードのそれぞれの k=1..N について、可能な限り最良の除算と可能な限り最小の誤差を計算することができます。それには、その子孫のそれぞれについて既に計算した可能な最小の誤差を調べ、利用可能なそれらの間のk分割。

別のアイデアを考えることで、これを回避しようとします。人生の見方にもよりますが、これには少なくとも 2 つの欠点があります。

1) あなたはパーティーに何も追加していないようです. 実際に天気予報を行う組織とそのクライアントの間に挟まれているようです。組織はクライアントとの直接的な接触を失い、たとえば広告収入を失う可能性があります。顧客は天気予報が悪くなります。

2) ほとんどのサイトには法的な利用規約があり、クライアントはそれを無視しても問題ありません。私の推測では、あなたはそれらの利用規約に違反しており、もしあなたのサービスが注目されるほど人気が​​出れば、あなたに対して強制されることになるでしょう.

于 2013-03-31T05:02:54.890 に答える