2

私はRが初めてで、時空間データに使用しています。ここ数週間、私は R の基礎を学び、時空間予測モデルを作成するための適切なパッケージ/適切な関数を見つけようとしました。

さまざまな時空間分析方法 (SpatioTemporal、spTimer など) のパッケージをいくつか見つけましたが、これらの関数/パッケージのいくつかは非常に複雑であることがわかりました。私のデータまたは私の研究の目的のために。そのため、どのパッケージと関数が自分のデータと研究の目的に適しているかを確実に判断するのに苦労しています。SO に関するトピックを検索すると、R を使用した (時空間) 分析の専門家がかなりいるようです。私の研究。

研究: 私の研究の目的は、ジオタグ付きの twitter メッセージに基づいて、都市内での暴力犯罪の発生確率を予測できる時空間予測モデルを作成することです。

データ: 私のデータには、インシデントとツイートの 2 つの主要コンポーネントがあります。

インシデント: 市内のインシデント データの 2 つの個別のデータセット (2 つの別々の期間) があります。これらには、市内の暴力犯罪インシデントが含まれます (各行は個別のケース/インシデントとして)。関連する列には、Datetime(Y%-m%-d% H%:M%、POSIXct として (今のところ))、LatitudeおよびLongitude座標 (個別の変数) が含まれます。したがって、これらには、インシデントの日時と、インシデントのポイント位置の緯度/経度座標が含まれます。

ツイート: このデータセットには、特定の活動/気分状態を示すキーワードを使用して集計された、市内から送信された (前述の期間をカバーする) ツイートが含まれます。インシデント データと同様に、このセットにはDatetime(上記と同じ形式)LatitudeLongitude座標が含まれます。そして (とりわけ) さらに、Keywordclusterツイートで見つかった関連キーワードを含むクラスターを示す変数 (さまざまなタイプの活動または気分状態に関連するキーワードを含む 21 のクラスター)。

そのため、インシデントとツイートの両方に、正確な時刻と正確な地点の位置 (緯度と経度の座標) を示す列が含まれています。目的は、個別のツイートで流行しているさまざまなキーワード クラスター (たとえば、1 つのクラスターにアルコール使用に関連するキーワードが含まれている) を使用して、地域内で暴力犯罪事件が発生する確率を予測することです。

目標は Twitter メッセージに基づいて凶悪犯罪を予測することであるため、モデルでは、事件が発生する前 (短期間) に送信されたツイート (たとえば、最大 24 時間以内に送信されたツイート) のみを考慮することが望ましいでしょう。事件前)。目的は、特定の短い期間 (データの性質上、最大で数時間または数日など) の間に特定の地域内で暴力犯罪が発生する確率を提供することです (つまり、ツイートを使用してインシデントの発生を予測することはありません)。 1 週間後))。

これが私のデータと私の研究の目的の適切な説明を提供することを願っています. どのパッケージと機能が適しているかについて、ある程度の確実性を提供していただければ、非常に感謝しています (そして、おそらくいくつかの追加のヒント)。これは本当に私を大いに助けてくれるでしょう!

前もってありがとう、M.スタム

4

0 に答える 0