テキストファイルにタイトル別にリストされた本のリストがあります。Google scholarやamazonなどのWebサービスを使用して本を検索し、各本の引用情報を含むxmlまたはbibtexファイルを返すことができるスクリプトを作成したいと思います。この種の自動検索に使用できるプログラミングツールはどれですか?
2 に答える
私のお勧めは Python です。
- テキストファイルから名前を取得、簡易ファイル読み込み
Google の book APIへの REST URL リクエストを作成する
http://books.google.com/books/feeds/volumes?q=エリザベス+ベネット&start-index=21&max-results=10
この URL からデータを取得するための単純な Python コード (API キーが必要な場合があります。urllib ではなく、エラー処理を伴う urllib2 を使用することをお勧めします)
サンプルコード、
import urllib
url = 'http://foo.api.request'
data = urllib.urlopen(url).read()
- この API の戻りスキーマを参照してください (XML は自由に使用できます)。
- 2 つの形式間の変換については、BibTeXML を参照してください。
HTH
どんなスクリプトを書きたいか具体的に書いていただけると助かります!
とにかく...いくつかの低レベルの作業を行って、Google と amazon 用に独自の HttpRequest を作成するか、たとえばhttp://code.google.com/apis/books/などの API に依存することができます。
あなたがやりたいことと似たようなことをする素晴らしいプロジェクトがあります。それは Shelves と呼ばれます。これは Android 向けに書かれていますが、リクエストを処理する方法についていくつかのアイデアを提供するはずです。いくつかの引用をダウンロードする代わりに、表紙をダウンロードしています。
http://code.google.com/p/shelves/
簡単な補足として、書籍を xml ファイルに保存することもできます。場合によっては、解析が容易になります。