-4

グループ購入サイトからデータ抽出アルゴリズムを作成して、取引のアグリゲーターを構築しようとしています。まず、タイトル、価格、割引、画像、座標を抽出するアルゴリズムが必要です。

画像、割引、座標のソリューションがありますが、タイトルとカテゴリの認識には単純なベイズ アルゴリズムを作成する必要があります。これを行うのに最適な言語は何ですか: php? パイソン?js? node.js?

アルゴリズムを作成するには何が必要ですか?

例のあるモデル?100 のタイトルを付けてから、いくつかのサイトのすべての Web コンテンツを付けて、スクリプトはどの文がタイトルであるかを認識できますか?

だから一言もいらない。私には文が必要ですが、その文は時々<h1> - <h2>別のものです。

4

2 に答える 2

0

AIアルゴリズムの経験がなく、学習できるアルゴリズムを追加したい場合は、Google予測APIを使用することをお勧めします。

https://developers.google.com/prediction/

于 2012-06-15T09:59:34.910 に答える
0

私はあなたの投稿の多くを真剣に理解することはできませんが、素朴なベイズはここSOで非常に一般的に要求されるものであるため、Pythonで追加のライブラリ(NLTKなど)なしで使用できる単純なコードを作成しました(また、よりもはるかに高速です)トレーニング用の NLTK)。ここで見つけることができます。

于 2012-06-15T09:56:38.613 に答える