データベーステーブルには約1000のレコードがあります。title
記事のタイトルを格納するために使用されるという名前の列があります。レコードを挿入する前に、同じタイトルの記事がそのテーブルにすでに存在するかどうかを確認する必要があります。もしそうなら、私はスキップします。
この種のあいまいマッチングを実行するための最速の方法は何ですか?文中のすべての単語が英語の辞書にあると仮定します。文#1の単語の70%が文#2で見つかった場合、それらは一致すると見なされます。理想的には、アルゴリズムは各文の値を事前に計算して、値をデータベースに保存できるようにすることができます。