sql - SQL での単語の共起 - これは可能ですか?

Question

私はこのようなデータセットを持っています

id | sentence                       | tags
1  | "people walk dogs in the park" | "pet park health"
2  | "I am allergic to dogs"        | "allergies health"

SQLクエリを使用して、各タグ単語と各文単語の間の共起数を見つけることは可能ですか? 各タグとセンテンスエントリを解析する必要があるため、難しいでしょう。

次のように見えるかもしれません

select sentence_word,tag_word,count(id)
from
(select id,sentence_word
from table)A

join

(select id, tag_word
from table)B

on A.id=B.id
group by sentence_word,tag_word

ただし、2 つのサブクエリが正しくないことはわかっています

ここにいくつかのサンプル結果があります

 tag_word   | sentence_word  | count(id)
"walk"      |"pet"           |1
"health"    |"dogs"          |2
"allergies" |"dogs"          |1

score 1 · Accepted Answer

次の行動計画を提案できます。

2 つの列をそれぞれ別の一時データベースに移動します。
文字列フィールドを列に変換するためにstored procedure(のように) を呼び出しますMySQL
CROSS JOIN2 つの一時テーブル
COUNT DISTINCT結果のデータセットで実行する

上記の手順は、独自のストアドプロシージャに組み合わせることができます。

の分割に関する記事はこちらですSQL Server。

一部の SQL 実装では、分割をとして実装できますuser defined functions。

sql - SQL での単語の共起 - これは可能ですか?

1 に答える 1

Related

Reference