2

記事公開プラットフォームの上に分析エンジンを構築したいと考えています。より具体的には、ユーザーの読書行動 (記事の閲覧回数、記事を開いた時間、評価など) と、記事自体の統計 (段落数、著者など) を追跡したいと考えています。 )。

これには 2 つの目的があります。

  1. ユーザーと記事に関する洞察を提示する
  2. ユーザーにおすすめを提供する

データ分析の部分では、 cubespandas 、およびpytablesを見てきました。大量のデータがあり、MySQL テーブルに格納されています。これらのパッケージのどれがそのようなバックエンドをより適切に処理できるかわかりません。

レコメンデーションの部分については、データ分析エンジンからクラスタリング モデルにデータをフィードすることだけを考えています。

これらすべてをまとめる方法についての推奨事項、および私を助けることができるクールな python プロジェクトはありますか? さらに情報を提供する必要がある場合はお知らせください。

ありがとうございました

4

2 に答える 2

3

Scikit-learnは、データ処理(クラスタリング)の部分に満足するはずです。

于 2012-09-14T14:37:24.347 に答える
2

分析と視覚化の面では、あなたが言及したようにCubesがあり、vizには私が書いたCubesViewerを使用しいます

于 2013-10-30T13:43:05.400 に答える