私は現在、人名の曖昧さ回避に関するプロジェクトを行っています。同姓同名の人が複数いる場合、正しい人を特定できるようにするというプロジェクトの背後にあるアイデア。これにはウィキペディアを使用しました。プロジェクトをいくつかの標準データで評価したいと考えています。私はいくつかのテストデータを探しています。私はウィキペディアの一般的な名前に精通していません。このデータをどこで見つけることができますか?膨大な量のデータを探しているわけではありません。100〜500の例を探しています。
ありがとうございました
質問にさらに情報を追加します。
私が探しているのは、同じ名前で実際には異なる人々です。たとえば、マイケル・ジョーダンは有名なバスケットボール選手で、その名前を持つ統計学者もいます。このような例を探しています。
http://en.wikipedia.org/wiki/Michael_Jordan http://en.wikipedia.org/wiki/Michael_I._Jordan
質問を理解していただければ幸いです。