アブストラクトとキーワードのために多くの pdf をスクレイピングするスクリプトを作成しました。また、抽出したテキストを配置する bibtex ファイルのコレクションもあります。私が探しているのは、bibtex ファイルに要素を追加する方法です。
私は短いパーサーを書きました:
#!/usr/bin/python
#-*- coding: utf-8
import os
from pybtex.database.input import bibtex
dir_path = "nime_archive/nime/bibtex/"
num_texts = 0
class Bibfile:
def __init__(self,bibs):
self.bibs = bibs
for a in self.bibs.entries.keys():
num_text += 1
print bibs.entries[a].fields['title']
#Need to implement a way of getting just the nime-identificator
try:
print bibs.entries[a].fields['url']
except:
print "couldn't find URL for text: %s " % a
print "creating new bibfile"
bibfiles = []
parser = bibtex.Parser()
for infile in os.listdir(dir_path):
if infile.endswith(".bib"):
print infile
bibfiles = Bibfile(parser.parse_file(dir_path+infile))
私の質問は、Pybtex を使用して要素を既存の bibtex ファイルに追加する (またはコピーを作成する) ことができるかどうかです。これにより、抽出を既に利用可能なものとマージできます。これが Pybtex で不可能な場合、他にどの bibtex パーサーを使用できますか?