私はこの質問についてウェブ上で何度も読みました:
ページの意味をどのように抽出しますか。
そして、私は解決策を提案しようとするほどの経験がないことを知っています. 私にとって、これは Web プログラミングの聖杯、あるいはコンピューター技術全体の聖杯です。
しかし、想像力を働かせて、まさにそれを行う究極のスクリプトを作成したと仮定しましょう。たとえば、次のテキストを入力します。
想像力は人類を暗黒時代から現在の文明状態へと導きました。想像力がコロンブスをアメリカ大陸発見へと導きました。想像力がフランクリンを電気の発見へと導きました。
私の強力なスクリプトは意味を抽出し、次のように言います。
人間の思考能力は、新しいものの発見につながります。
この例では、テキストの意味を説明するために「文字列」を使用しました。しかし、これをデータベース、配列、またはその他の種類のストレージに格納する必要がある場合、使用するデータ型は何になるでしょうか?
別のアナロジーを使用しているが、同じ意味を別の言葉で表現した別のテキストを使用できることに注意してください。たとえば、次のようになります。
想像力は人類の進歩を助けます。
ここで、想像力の重要性に関する検索クエリを入力すると、次の 2 つの結果が表示されます。しかし、それらはどのように一致するのでしょうか? 文字列比較になりますか?いくつかの整数、浮動小数点?たぶんバイナリ?
意味は何の下に保存されますか?ご連絡をお待ちしております。
更新:質問を簡単に言い直しましょう。
データの意味をどのように表現しますか?