1

NLP、セマンティック データのストレージ、コンテンツ管理などの要件を備えたプロジェクトを開始しています。Apache Stanbol が適しているように思えますが、準備ができているかどうか正確にはわからないため、事前に適切な評価をしようとしています。私を心配することはほとんどないので、それを使い始めます:

  1. Stanbol は少し若く未熟なようです (最新バージョン 0.12)。商用プロジェクト/アプリケーション/セットアップで使用した人はいますか (この情報をオンラインで見つけることができませんでした)。それらのプロジェクトの規模はどのくらいですか?

  2. Stanbol の水平方向のスケーラビリティはどの程度ですか? そのクラウド/クラスタリング機能は何ですか? 私の知る限り、ストレージは Apache Jena に依存しており、Jena ストレージは水平方向にスケーラブルではないため、Stanbol も水平方向にスケーリングできません。これについては間違っているかもしれませんが、これは私の現在の理解です。間違っている場合は修正してください。Jena を別のものと交換して、RDF ストレージ プロバイダーとして使用することもできますが、私はそれを認識していません。

  3. Stanbol の学習リソースは少し不足しているようです。Stanbol の内部をもっと理解できる場所/本/何でも知っている人はいますか? (Stanbol の公式 Web サイトと IKS Web サイト以外で) 良い代替手段はありますか?NLP に関して優れた代替手段 (GATE、UIMA など) があることは知っていますが、それらには CMS 機能がありません。

ありがとう。

4

2 に答える 2

2

あなたの質問に:

  • 1) Stanbol(バージョン 0.10) を含むプロジェクトに取り組んでいます。まだ製作前の段階です。CMS については、JackRabbit と Alfresco を評価しました。私たちの場合、Alfresco (CMIS) がより良い選択であることがわかりました。stanbol で私が気に入っているのは、デフォルトで付属する拡張チェーンと一連の 拡張エンジン です。これは中小規模のプロジェクトです。
  • 3) この(Instant Apache Stanbol、Packt Publishing) は、私の仕事、特にエンティティ ハブと拡張エンジンに関するセクションを進めている間、非常に実用的で有用であることがわかりました。
于 2014-05-15T04:33:34.200 に答える