python - データ分析と学習のための Python パッケージの推奨事項

Question

記事公開プラットフォームの上に分析エンジンを構築したいと考えています。より具体的には、ユーザーの読書行動 (記事の閲覧回数、記事を開いた時間、評価など) と、記事自体の統計 (段落数、著者など) を追跡したいと考えています。）。

これには 2 つの目的があります。

データ分析の部分では、 cubes、pandas 、およびpytablesを見てきました。大量のデータがあり、MySQL テーブルに格納されています。これらのパッケージのどれがそのようなバックエンドをより適切に処理できるかわかりません。

レコメンデーションの部分については、データ分析エンジンからクラスタリングモデルにデータをフィードすることだけを考えています。

これらすべてをまとめる方法についての推奨事項、および私を助けることができるクールな python プロジェクトはありますか? さらに情報を提供する必要がある場合はお知らせください。

ありがとうございました

score 3 · Accepted Answer

3

Scikit-learnは、データ処理（クラスタリング）の部分に満足するはずです。

于 2012-09-14T14:37:24.347 に答える

score 2 · Accepted Answer

分析と視覚化の面では、あなたが言及したようにCubesがあり、vizには私が書いたCubesViewerを使用しています。

2 に答える 2