私は最近、救急医療サービスから提供された巨大なデータセットを扱い始めました。インシデントの cca 25.000 空間ポイントがあります。
私はかなり長い間本やインターネットを検索しており、何をどのように行うべきかについてますます混乱しています.
もちろん、ポイントは非常に集中しています。K、L、G 関数を計算したところ、深刻なクラスタリングが確認されました。
また、人口ポイント データセットもあります。これは、市民ごとに 1 つのポイントであり、インシデント データセットと同様にクラスター化されています (インシデントは人に発生するため、これら 2 つのデータセットの間には強い関連性があります)。
これら 2 つのデータセットを比較して、それらが同様に分布しているかどうかを調べたいと思います。人口に対して事件が多い場所があれば知りたいです。言い換えれば、人口データセットを使用して強度を説明し、インシデント データセットがその強度に対応するかどうかを判断したいと考えています。前提として、インシデントは母集団に関してランダムに出現する必要があります。
事件がランダムに人々に起こった場合、予想よりも多いまたは少ない事件がある情報を含む地域のプロットを取得したいと考えています。
Rでどうするの?
K 関数を計算するには、Kest または Kinhom を使用する必要がありますか? 説明を読みましたが、それらの基本的な違いは何なのかまだわかりません。
私は Kcross を使用してみましたが、私が理解したように、使用される 2 つのデータセットのうちの 1 つは CSR である必要があり、完全に空間的にランダムです。Kcross.inhom も見つけましたが、それをデータに使用する必要がありますか?
人口に関するインシデント偏差のプロット (画像) を取得するにはどうすればよいですか?
私は明確に尋ねたことを願っています。
私の質問を読んでいただきありがとうございます。私の質問に答えていただければさらに感謝します。
よろしくお願いします!
イェルネイ