ここで解決する必要がある 2 つの別個の問題があります。
- リンクする単語の決定
- これらの単語をリンクする適切なエントリがあるかどうかを判断する
さて、(2) の方が簡単ですが、やや問題があります。ウィキペディアには、データを効率的に収集できるAPIがあるようで、「スクリーン スクレイピング」も可能です。しかし、明確化には問題があります - 時々、あなたが望んでいたエントリにヒットしないかもしれません。たとえば、pythonは曖昧さ回避ページにリンクしています。これは、プログラミング言語、スネーク、およびその他のいくつかのものである可能性があるためです。
(1) ただし、はるかに難しいです。「単純なアプローチ」を取り、自明ではないすべての名詞 (または名詞/形容詞のペア) のリンクを見つけようとすることができます。ここでの自明ではないということは、「悪魔、単語、コンピューター」などの単語を省略することを意味します。テキストの何が面白いかを決めるのは本当にあなた次第であり、これはテキスト自体に大きく依存します. プロのプログラマー向けの記事で、本当に毎回「検索アルゴリズム」にリンクするのですか?しかし、初心者にとっては、おそらくそうです。
結論として、このトリックを実行できる単一の汎用ツールがあるとは思えません。しかし、確かにすべてのオプションが手元にあり、特定のニーズに合わせて何かをコード化することは、あまり労力をかけずに行うことができます。