PDF ファイルからテキストを抽出するツールは数多くあります [1-4]。しかし、ほとんどの科学論文の問題は、PDF に直接アクセスするのが難しいことです。bibtex 情報だけでなく、メタデータや bibtex などの論文情報に簡単にアクセスできるツールがあります[5-6]。私が望むのは、一歩前進して、bibtex/メタデータだけを超えたものになることです。
出版物の PDF ファイルに直接アクセスできないと仮定すると、論文の DOI またはタイトルが与えられた科学論文の少なくとも要約を取得する方法はありますか? 私の検索では、同様の目的でいくつかの試み [7] があることがわかりました。科学論文の要約または全文を取得/抽出するのに役立つウェブサイト/ツールを知っている人はいますか? そのようなツールがない場合、この問題を解決した後にどうすればよいか、いくつか提案をいただけますか?
ありがとうございました
[1] http://stackoverflow.com/questions/1813427/extracting-information-from-pdfs-of-research-papers
[2] https://stackoverflow.com/questions/6731735/extracting-the-actual-in-text-title-from-a-pdf
[3] http://stackoverflow.com/questions/6731735/extracting-the-actual-in-text-title-from-a-pdf?lq=1
[4] http://stackoverflow.com/questions/14291856/extracting-article-contents-from-pdf-magazines?rq=1
[5] https://stackoverflow.com/questions/10507049/get-metadata-from-doi
[6] https://github.com/venthur/gscholar
[7] https://stackoverflow.com/questions/15768499/extract-text-from-google-scholar