0

大規模な引用データが必要な研究を行っています。Web of Science のデータベースにアクセスしたいと思います。たとえば、2013 年に Nature に掲載されたすべての論文の引用が必要な場合があります。そのようなデータセットを取得するにはどうすればよいですか? Web of Science はユーザーにデータベースを公開していますか? それとも、どうにかして自分でデータをクロールする必要がありますか? どんな提案でも大歓迎です。T

4

1 に答える 1

0

自分のコンピューターでオフラインで引用を取得したい場合は、データをクロールして保存する必要があります。データをクロールするには、Apache Tika をお勧めします。「Apache Tika™ ツールキットは、既存のパーサー ライブラリを使用して、PPT から CSV、PDF まで、さまざまなドキュメントからメタデータとテキスト コンテンツを検出して抽出します」 - Tika Web サイトApache Tikaから。

大規模な話ですが、これが最善の方法だと思います。ダウンロードすると、リモート検索の待ち時間のために検索が完了するのを待つことなく、コンピューターで必要な多くの検索を実行できるからです。

于 2014-07-10T02:22:47.847 に答える