AC
次のような構造の SQL Server に データ テーブルがあります。
+----------+------------+-------+
| AuthorID | CoAuthorID | Year |
+----------+------------+-------+
| 677 | 901706 | 2005 |
| 677 | 901706 | 2005 |
| 677 | 901706 | 2005 |
| 1359 | 133112 | 2005 |
| 1359 | 133112 | 2005 |
| 1359 | 133112 | 2005 |
| 1359 | 266386 | 2005 |
| 1359 | 454557 | 2005 |
| 1359 | 454557 | 2005 |
| 1359 | 454557 | 2005 |
| 1359 | 534423 | 2005 |
| 1359 | 534423 | 2005 |
| 1359 | 534423 | 2005 |
| 1359 | 578338 | 2005 |
| 1359 | 721615 | 2005 |
| 1359 | 1016805 | 2005 |
| 1359 | 1016805 | 2005 |
| 1359 | 1016805 | 2005 |
| 1359 | 1361047 | 2005 |
| 1359 | 1361047 | 2005 |
| 1359 | 1361047 | 2005 |
| 1359 | 1361320 | 2005 |
| 1359 | 1361320 | 2005 |
| 1359 | 1361320 | 2005 |
| 1359 | 1395982 | 2005 |
| 1359 | 1395982 | 2005 |
| 1359 | 1395982 | 2005 |
| 1359 | 1412785 | 2005 |
| 1359 | 1412785 | 2005 |
| 1359 | 1412785 | 2005 |
| 1359 | 1412785 | 2005 |
| ... | | |
| ... | | |
+----------+------------+-------+
与えられた年次を計算する必要がありConditional Probability
ますAuthorID
CoAuthorID
P(AuthorID|CoAuthorID)
=P(AuthorID ∩ CoAuthorID) / P(CoAuthorID)
2005
交差点操作である 年に。
最初に、たとえばAuthorID = 677
and CoAuthorID = 901706
and Year = 2005
、私はこれを試しました:
の場合P(AuthorID)
:
SELECT COUNT(DISTINCT AuthorID) FROM AC WHERE Year = 2005
390
そう返すP(AuthorID)
=1/390
の場合P(CoAuthorID)
:
SELECT COUNT(DISTINCT CoAuthorID) FROM AC WHERE AuthorID = 677 AND Year = 2005
1
そう返すP(CoAuthorID)
=1/1
の場合P(AuthorID ∩ CoAuthorID)
:
SELECT * FROM AC WHERE AuthorID = 677 AND Year = 2005
INTERSECT
SELECT * FROM AC WHERE CoAuthorID = 901706 AND Year = 2005
次のように 1 行を返します。
AuthorID CoAuthorID Year
----------------------------
677 901706 2005
データに 3 行あるのに対し、データに 3 回共存するということはAuthorID
、この 2 人の著者が 2005 年に 3 回一緒に貢献したことを意味します。 CoAuthorID
2005
- の値は
P(AuthorID ∩ CoAuthorID)
何ですか?1
それとも1/3
?_ - また、他の計算は正しいですか?
ありがとう!