4

私が働いている会社は、出版、eコマース、オンライン印刷などのさまざまなアドオンを備えたコンテンツ管理システム(CMS)を作成しています。現在、「レポートモジュール」を追加中です。どの戦略を検討する必要がありますか?従う。「レポートモジュール」は、ビジネスインテリジェンスまたはBIとも呼ばれます。

このモジュールは、アイテムのダウンロードを追跡し、検索を実行し、そこからさまざまなレポートを作成できるようになっています。実際、長期的には、必要と思われるものをプッシュしてレポートを取得できるようにしたい場合があるため、どのような種類のデータがチャーンされているかはそれほど重要ではありません。

大まかに言えば、2つの選択肢があります。

オプション1は、Apache Solrに基づくソリューションを作成することです(具体的には、https: //issues.apache.org/jira/browse/SOLR-236を使用します)。このアプローチの長所:

  • 無料/オープンソース/良質
  • 他の場所でSolr/Luceneを使用しているため、ドメインをよく知っています
  • 受信データ(XML形式)を取得し、XSLTを介してプッシュし、Solrにフィードできるため、インデックス作成されているものに対する完全な柔軟性
  • 検索結果を表示する方法の完全な柔軟性。上記の手順と同様に、カスタムXSLT検索テンプレートを使用して、必要と思われる形式で結果を表示することができます。
  • フロントエンド開発者はXSLTに精通しているため、このメカニズムを別の顧客に適合させるのは比較的簡単です。
  • Solrは、私たちにとって絶対に必要なリアルタイム/全文/ファセット検索を提供します。クイックプロトタイプ(Solr、1Mレコードに基づく)は、55ミリ秒で検索結果を提供することができました。レコードの推定最大数は約10億行であり(これは通常のBIアプリではそれほど多くありません)、さらに悪化した場合は、SolrCloudなどをいつでも確認できます。
  • Solrを使用して非常に類似したことをしている会社があります(たとえば、Honeycomb Lexicon)

このアプローチの短所:

  • SOLR-236は安定している場合とそうでない場合があります。さらに、公式リリースの一部としていつリリースされるか、またはリリースされるかどうかはまだ明確ではありません。
  • BI固有の機能を動作させるには、作成する必要のあるものがいくつかある可能性があります。これは、車輪の再発明のように聞こえます
  • 最大の問題は、将来何が必要になるかわからないことです(BIソフトウェアとの統合、Excelへのエクスポートなど)。

オプション2は、無料または商用のBIソフトウェアと統合することです。これまで、Wabitについて見てきましたが、QlikView、おそらく他の人についても見ていきます。このアプローチの長所:

  • 車輪の再発明をする必要はありません。ソフトウェアは(うまくいけば)試され、テストされています
  • 私たちが専門とする問題の解決に費やすことができる時間を節約できます

短所:

  • 私たちはJavaショップであり、ソリューションはクロスプラットフォームであるため、市場に出回っている多くのオプションを排除する必要があります。
  • BIソフトウェアがどれほど柔軟にできるかわかりません。一部のBIオファリングを調べて、柔軟なインデックス作成、リアルタイム/全文検索、完全にカスタマイズ可能な結果などを実行できるかどうかを確認するには時間がかかります。
  • オープンソースのBIオファーは十分に成熟していないと言われましたが、商用BI(SAP、その他)は大金がかかり、ライセンスは数万ポンド/ドルから始まります。私はそれ自体が商業的選択に反対しているわけではありませんが、それは簡単に大きくなりすぎる可能性がある全体的な価格になります
  • BIがスキーマレスデータでどの程度うまく機能するかわからない

私は市場で最も適切な統合オプションを見つけるのに最適な候補ではありませんが(主にBI分野の知識がないため)、迅速に決定を下す必要があります。

誰かが同様の状況にあり、どのルートを取るべきか、またはさらに良い方法についてアドバイスすることができますか?オプション#2の可能な長所/短所についてアドバイスしますか?ここでの最大の問題は、私が知らないことを知らないということです;)

4

3 に答える 3

3

私はQlikViewWabitの両方で遊んだことがありますが、言うまでもなく、私は非常に失望しています。

私は、BI業界全体が実際にその下に何らかの科学を持っていることを期待していましたが、私が見つけたものから、これは単なる流行語にすぎません。このMSDNの記事は、実際には目を見張るものでした。BIのビジネス全体は、十分に正規化されたスキーマ(OLTPと呼ばれます)からデータを取得し、それを正規化されていないスキーマ(OLAPスノーフレーク、またはスタータイプ)に入れ、必要なすべての側面のインデックスを作成することで構成されます(業界用語これはデータキューブです)。残りは、きれいなグラフを取得するためのスクリプトです。

OK、私はここで物事を単純化しすぎていることを知っています。私は多くの異なる側面(素晴らしいレポート?Excelへのエクスポート?予測?)を見逃したかもしれないことを知っていますが、コンピューターサイエンスの観点からは、ここでデータベースインデックス以外のものを見ることができません。

一部のBIツールは圧縮をサポートしていると言われました。Luceneもそれをサポートしています。一部のBIツールはすべてのインデックスをメモリに保持できると言われました。そのために、Luceneキャッシュがあります。

2つの候補(WabitとQlikView)について言えば、最初の候補は単純に未成熟です(デモで提案されたものの外に出ようとすると、数十の例外があります)が、もう1つはWindowsでのみ機能します(あまり良くありませんが、私はそれと一緒に暮らすことができました)そして統合は私にいくつかのVBScriptを書くことを要求するでしょう(うん!)。単純な日付範囲制御を機能させるためだけにQlikViewフォーラムで数時間を費やす必要がありましたが、私が持っていたPersonal Editionは、サイトで利用可能なダウンロード可能なデモプロジェクトをサポートしていなかったため失敗しました。誤解しないでください。どちらも、それらが構築された目的のための優れたツールですが、あまり得られないので、それらと統合する意味がまったくわかりません。

Solrの(議論の余地のある)未熟さに対処するために、抽象APIを定義して、問題が発生した場合に全文クエリをサポートするデータベースにすべてのデータを移動できるようにします。さらに悪化した場合は、必要に応じていつでもSolr/Luceneの上に何かを書くことができます。

于 2010-12-02T16:27:49.210 に答える
1

自分が何を知らないのかわからないシナリオに本当にいる場合は、独自の実装に飛び込む前に、オープンソースツールを調べてその有用性を評価するのが最善だと思います。オープンソースソリューションを使用すると、自分の理解と必要な機能をさらに具体化するのに役立つ可能性があります。
私は以前、Pentahoと呼ばれるオープンソースソリューションを使用して作業していました。Pentahoの機能を自分の目的に使うことを学ぶことで、私はもっと多くのことを理解したと真剣に感じました。もちろん、ほとんどのオープンソースソリューションで作業する場合と同様に、Pentahoは最初は少し怖かったように見えましたが、1か月でうまく把握できました。また、KettleETLツールとMondrianを使用しましたキューブ-最近の本格的なBIツールのほとんどはその上に構築されていると思います。
以前は、これらのコンポーネントはすべて独立していましたが、遅れて、Pentahoがこれらすべてのプロジェクトの所有権を取得したと思います。

しかし、必要なものと不要なものに自信が持てたら、モンドリアンの実装の上に独自の基本的なレポートツールを構築することをお勧めします。洗練されたオープンソースツールのカスタマイズは、確かに大きな問題になる可能性があります。その上、用心すべきライセンスがあります。PentahoはGPLだと思いますが、それを確認することをお勧めします。

于 2010-11-30T18:56:38.467 に答える
1

まず、レポートに何を表示するかを明確にする必要があります。どのレポート機能が必要ですか?どの出力フォーマットが必要ですか?ブラウザ(HTML)、PDF、またはインタラクティブビューア(Java / Flash)で表示しますか。データ(データベース、Javaなど)はどこにありますか?アドホックレポートが必要ですか、それともハードコードされたレポートのみが必要ですか?これはほんの一部の質問です。

この質問への回答がなければ、実際の推奨事項を提示することは困難ですが、私の一般的な推奨事項は、i-net Clear Reports(以前はi-net Crystal-Clearと呼ばれていました)です。これはJavaツールです。これは商用ツールですが、SAPと共同でコストが低くなります。

于 2010-12-04T23:22:53.210 に答える