OpenEphyra は自然言語よりも最適に動作します。つまり、答えを見つけるには大きなテキスト ブロックが必要です。マシンにローカルに挿入するデータのデフォルトのナレッジ マイナーである Indri は、C および C++ で書かれており、OpenEphyra へのインターフェイスを備えていますが、不安定でエラーが多いことがわかりました。これは、Apache Lucene を使用して OpenEphyra のドキュメントのインデックス作成と取得を行う KnowledgeMiner クラスを作成したときに大幅に改善されました。したがって、OpenEphyra を使い続けることに決めた場合は、データベースを介してデータにアクセスする同様の KnowledgeMiner を作成するのがおそらく最適です。
そうは言っても、おそらく、IBM Watson for Jeopardy で使用されているテクノロジーのいくつかを検討する必要があります。オープンソースの UIMA は良い出発点ですが、Tony Pearson のブログ (ibm.co/Pearson) では、データベースに支えられた独自の質問応答システムを構築する方法について、非常に優れたチュートリアルを提供しています。