1

皆さん、私はDBLPについていくつかの調査を行っており、Hugh Glaserのリポジトリ、RKB-EXPLORER DBLP(rdf/xml)を使用しています。dblp の記事のこのページを検討してください。

http://dblp.rkbexplorer.com/id/journals/jvcir/YuanWSZ13

ご覧のとおり、この記事の著者 ID は次のようなものです。

http://dblp.rkbexplorer.com/id/people-b3f641eef09c498bdd94087b74854be9-36a6b8e7b69947e5659953aaf7fb802c .

異なる記事で同じ著者名を試してみたところ、上記の ID が次のように詳細に表示されていることがわかりました。

b3f641eef09c498bdd94087b74854be9: 著者名の 32 文字コード。

そのため、実際には「同名」の人に同じ ID を与えますが、多くの人はまったく同じ名前を持っています。これは曖昧です。dblp 作成者の曖昧さ回避のために、以下の 2 つのアプローチを試しました。

  1. 各記事の所属を取得し、同じ名前が同じ所属の 2 つの記事に表示された場合。これは同一人物で間違いないと思います。しかし難しいのは、dblp.rkbelporer.com データセットがこれに関する十分な情報を提供していないことです。Google 検索を使用して記事のタイトルを検索しても、十分な情報が得られません。
  2. 各記事のすべての著者の画像を取得し、個人的な画像照合のようなことを行って、同一人物であるかどうかを確認します。しかし、著者の記事の個人的な画像が少なすぎるため、これもある種の実現不可能です。

それで、何か提案はありますか?どうも。

4

0 に答える 0