NLP、セマンティック データのストレージ、コンテンツ管理などの要件を備えたプロジェクトを開始しています。Apache Stanbol が適しているように思えますが、準備ができているかどうか正確にはわからないため、事前に適切な評価をしようとしています。私を心配することはほとんどないので、それを使い始めます:
Stanbol は少し若く未熟なようです (最新バージョン 0.12)。商用プロジェクト/アプリケーション/セットアップで使用した人はいますか (この情報をオンラインで見つけることができませんでした)。それらのプロジェクトの規模はどのくらいですか?
Stanbol の水平方向のスケーラビリティはどの程度ですか? そのクラウド/クラスタリング機能は何ですか? 私の知る限り、ストレージは Apache Jena に依存しており、Jena ストレージは水平方向にスケーラブルではないため、Stanbol も水平方向にスケーリングできません。これについては間違っているかもしれませんが、これは私の現在の理解です。間違っている場合は修正してください。Jena を別のものと交換して、RDF ストレージ プロバイダーとして使用することもできますが、私はそれを認識していません。
Stanbol の学習リソースは少し不足しているようです。Stanbol の内部をもっと理解できる場所/本/何でも知っている人はいますか? (Stanbol の公式 Web サイトと IKS Web サイト以外で) 良い代替手段はありますか?NLP に関して優れた代替手段 (GATE、UIMA など) があることは知っていますが、それらには CMS 機能がありません。
ありがとう。