オンラインの記事を使用して、ゼロから独自のナレッジ ベースを構築しています。
スクレイピングした SPO トリプル (サブジェクトと場合によってはオブジェクト) のエンティティを、他の Web サイトからスクレイピングした上場企業で構成されるエンティティの独自のレコードにマッピングしようとしています。
ほとんどのライブラリを調査しましたが、その方法はエンティティを Wikipedia や YAGO などの大きなナレッジ ベースにマッピングすることに重点を置いていますが、これらの手法を自分のナレッジ ベースに適用する方法がよくわかりません。
現在、それができると主張する NEL Python パッケージを見つけましたが、ドキュメントをよく理解できず、Wikipedia のデータ ダンプのみに焦点を当てています。
それを可能にするテクニックやライブラリはありますか?