私が働いている会社は、出版、eコマース、オンライン印刷などのさまざまなアドオンを備えたコンテンツ管理システム(CMS)を作成しています。現在、「レポートモジュール」を追加中です。どの戦略を検討する必要がありますか?従う。「レポートモジュール」は、ビジネスインテリジェンスまたはBIとも呼ばれます。
このモジュールは、アイテムのダウンロードを追跡し、検索を実行し、そこからさまざまなレポートを作成できるようになっています。実際、長期的には、必要と思われるものをプッシュしてレポートを取得できるようにしたい場合があるため、どのような種類のデータがチャーンされているかはそれほど重要ではありません。
大まかに言えば、2つの選択肢があります。
オプション1は、Apache Solrに基づくソリューションを作成することです(具体的には、https: //issues.apache.org/jira/browse/SOLR-236を使用します)。このアプローチの長所:
- 無料/オープンソース/良質
- 他の場所でSolr/Luceneを使用しているため、ドメインをよく知っています
- 受信データ(XML形式)を取得し、XSLTを介してプッシュし、Solrにフィードできるため、インデックス作成されているものに対する完全な柔軟性
- 検索結果を表示する方法の完全な柔軟性。上記の手順と同様に、カスタムXSLT検索テンプレートを使用して、必要と思われる形式で結果を表示することができます。
- フロントエンド開発者はXSLTに精通しているため、このメカニズムを別の顧客に適合させるのは比較的簡単です。
- Solrは、私たちにとって絶対に必要なリアルタイム/全文/ファセット検索を提供します。クイックプロトタイプ(Solr、1Mレコードに基づく)は、55ミリ秒で検索結果を提供することができました。レコードの推定最大数は約10億行であり(これは通常のBIアプリではそれほど多くありません)、さらに悪化した場合は、SolrCloudなどをいつでも確認できます。
- Solrを使用して非常に類似したことをしている会社があります(たとえば、Honeycomb Lexicon)
このアプローチの短所:
- SOLR-236は安定している場合とそうでない場合があります。さらに、公式リリースの一部としていつリリースされるか、またはリリースされるかどうかはまだ明確ではありません。
- BI固有の機能を動作させるには、作成する必要のあるものがいくつかある可能性があります。これは、車輪の再発明のように聞こえます
- 最大の問題は、将来何が必要になるかわからないことです(BIソフトウェアとの統合、Excelへのエクスポートなど)。
オプション2は、無料または商用のBIソフトウェアと統合することです。これまで、Wabitについて見てきましたが、QlikView、おそらく他の人についても見ていきます。このアプローチの長所:
- 車輪の再発明をする必要はありません。ソフトウェアは(うまくいけば)試され、テストされています
- 私たちが専門とする問題の解決に費やすことができる時間を節約できます
短所:
- 私たちはJavaショップであり、ソリューションはクロスプラットフォームであるため、市場に出回っている多くのオプションを排除する必要があります。
- BIソフトウェアがどれほど柔軟にできるかわかりません。一部のBIオファリングを調べて、柔軟なインデックス作成、リアルタイム/全文検索、完全にカスタマイズ可能な結果などを実行できるかどうかを確認するには時間がかかります。
- オープンソースのBIオファーは十分に成熟していないと言われましたが、商用BI(SAP、その他)は大金がかかり、ライセンスは数万ポンド/ドルから始まります。私はそれ自体が商業的選択に反対しているわけではありませんが、それは簡単に大きくなりすぎる可能性がある全体的な価格になります
- BIがスキーマレスデータでどの程度うまく機能するかわからない
私は市場で最も適切な統合オプションを見つけるのに最適な候補ではありませんが(主にBI分野の知識がないため)、迅速に決定を下す必要があります。
誰かが同様の状況にあり、どのルートを取るべきか、またはさらに良い方法についてアドバイスすることができますか?オプション#2の可能な長所/短所についてアドバイスしますか?ここでの最大の問題は、私が知らないことを知らないということです;)