2

記事 (PDF ファイル) を保存および検索できる研究データベースを作成したいと考えています。助言がありますか?

いくつかのリレーショナル データベースのチュートリアルを見てきましたが、ドキュメントの保存と取得について言及しているものはなく、生データのみを参照しています。

4

2 に答える 2

1

従来のデータベース アプローチの代わりに、Elasticsearch、Solr、または Lucene などを使用することを検討します。メタデータのインデックス作成、検索、およびアクセスを行うことができます。

アタッチメント プラグインを介した Elasticsearch の方法は次のとおりです: https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-attachment-type.html および例:
http://www.hashcode.eti。 br/?p=420

Solr:
https://gist.github.com/nichtich/429904

および Lucene:
https://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_PDF_documents.3F

于 2015-09-15T03:12:09.320 に答える
0

ローカル コンピューターでビルドするには、すべてのファイルを 1 つのフォルダー/ディレクトリに配置し、一意の名前を付けます。任意のデータベース (Postgres、mysql、sqlite、mongo など) を使用して、メタデータを保存し、PDF ファイルを名前で参照します。データベースに入れても、それでできることは何もありません。

インターネット上で構築するには、同じですが、Amazon S3 などを使用して PDF ファイルを保存します。記事の追加や評価など、他の人があなたと共同作業することを想定している場合は、Web UI を構築することを決定するかもしれません。

于 2015-09-15T01:57:55.510 に答える