記事 (PDF ファイル) を保存および検索できる研究データベースを作成したいと考えています。助言がありますか?
いくつかのリレーショナル データベースのチュートリアルを見てきましたが、ドキュメントの保存と取得について言及しているものはなく、生データのみを参照しています。
記事 (PDF ファイル) を保存および検索できる研究データベースを作成したいと考えています。助言がありますか?
いくつかのリレーショナル データベースのチュートリアルを見てきましたが、ドキュメントの保存と取得について言及しているものはなく、生データのみを参照しています。
従来のデータベース アプローチの代わりに、Elasticsearch、Solr、または Lucene などを使用することを検討します。メタデータのインデックス作成、検索、およびアクセスを行うことができます。
アタッチメント プラグインを介した Elasticsearch の方法は次のとおりです:
https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-attachment-type.html
および例:
http://www.hashcode.eti。 br/?p=420
Solr:
https://gist.github.com/nichtich/429904
および Lucene:
https://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_PDF_documents.3F
ローカル コンピューターでビルドするには、すべてのファイルを 1 つのフォルダー/ディレクトリに配置し、一意の名前を付けます。任意のデータベース (Postgres、mysql、sqlite、mongo など) を使用して、メタデータを保存し、PDF ファイルを名前で参照します。データベースに入れても、それでできることは何もありません。
インターネット上で構築するには、同じですが、Amazon S3 などを使用して PDF ファイルを保存します。記事の追加や評価など、他の人があなたと共同作業することを想定している場合は、Web UI を構築することを決定するかもしれません。