Microsoft Word Docs、PowerPoint、PDF、テキスト ファイルなどのドキュメントのコーパスを中心に検索エンジンを構築しています。ElasticSearch を正常にダウンロードしてインストールし、実行しました (コマンド プロンプトとブラウザーから表示できます - localhost:9200)。
手動で入力したデータをアップロードして検索できます (オンラインのいくつかのチュートリアルで見つかります - このような: http://www.elasticsearchtutorial.com/elasticsearch-in-5-minutes.html#Indexing )
ここで、手動で入力されたデータの検索から、構造化されたテキスト ファイルの大規模なコーパスの検索に (大規模な?) ジャンプを行う必要があります。私の質問は、これらのドキュメントをアップロード/インデックス付けして、すでに実行している Elasticsearch インスタンスで使用できるようにする方法です。
これは大きすぎて 1 回の返信で答えることができない場合があることを理解しています。ツールやチュートリアルのリンクを示しても役に立ちます。
バージョン: Windows 7、Elasticsearch 1.2.1