基本的なシナリオは次のとおりです。たとえば、100,000 件の新聞のような記事のコーパスがあります。最低限、それらはすべて明確に定義されたタイトルと、ある程度の本文コンテンツを持ちます。
私がやりたいのは、他の記事にリンクすべき記事のテキストの続きを見つけることです。
したがって、記事 Foo に「8 年生の生徒は John-Paul Sartre の作品を読むよう奨励されています」のような一連のテキストがあり、記事 Bar に「John-Paul Sartre の重要な作品」というタイトル (およびそれについて) がある場合、I' Foo のテキスト内に Foo から Bar への HTML リンクを自動的に作成したいと考えています。