グループ購入サイトからデータ抽出アルゴリズムを作成して、取引のアグリゲーターを構築しようとしています。まず、タイトル、価格、割引、画像、座標を抽出するアルゴリズムが必要です。
画像、割引、座標のソリューションがありますが、タイトルとカテゴリの認識には単純なベイズ アルゴリズムを作成する必要があります。これを行うのに最適な言語は何ですか: php? パイソン?js? node.js?
アルゴリズムを作成するには何が必要ですか?
例のあるモデル?100 のタイトルを付けてから、いくつかのサイトのすべての Web コンテンツを付けて、スクリプトはどの文がタイトルであるかを認識できますか?
だから一言もいらない。私には文が必要ですが、その文は時々<h1> - <h2>
別のものです。