私はこのようなデータセットを持っています
id | sentence | tags
1 | "people walk dogs in the park" | "pet park health"
2 | "I am allergic to dogs" | "allergies health"
SQLクエリを使用して、各タグ単語と各文単語の間の共起数を見つけることは可能ですか? 各タグとセンテンス エントリを解析する必要があるため、難しいでしょう。
次のように見えるかもしれません
select sentence_word,tag_word,count(id)
from
(select id,sentence_word
from table)A
join
(select id, tag_word
from table)B
on A.id=B.id
group by sentence_word,tag_word
ただし、2 つのサブクエリが正しくないことはわかっています
ここにいくつかのサンプル結果があります
tag_word | sentence_word | count(id)
"walk" |"pet" |1
"health" |"dogs" |2
"allergies" |"dogs" |1