問題タブ [site-mining]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
site-mining - サイトマイニング ツール
ここで尋ねられる質問の多くは、私が行っている研究に関連しています。これらの質問と回答は広く分散しており、手動でブラウジングすることで常に簡単に見つけることができるわけではありません。
一連のキーワードに基づいて、これらの関連する Q & A を自動的に検索し、その情報をさらに詳細な調査へのポインタとして使用したいと考えています。
この種のサイトマイニングに使用できるツール (できればオープンソース) はありますか? 私はウェブの第一人者ではありません。それらを開発しようとすると長い時間がかかり、R&D に費やすことができた時間にも影響を与えます。
data-mining - 車両検索に最適なデータマイニング方法は何ですか?
私は、Ooodle、eBay motors、craigslist などのオンラインの自動車広告を検索する検索エンジンを構築しようとしています。また、標準的な車両名とそれらに関する仕様の大規模なデータベースもあります。私がやりたいことは、分類されたサイトで見つけた各レコードについて、それがどの車両モデル、スタイルであるか (私のデータベースから) を正確に判断できるようにすることです。たとえば、私のデータベースでのフォード トラックの標準的な名前は、2003 Ford F150 です。
ただし、分類されたサイトでは、「2003 Ford F 150」または「2003 Ford f-150」または「03 Ford truck 150」と呼ばれることがあります。これらのテキストを上記の標準名に正規化できる効果的なデータ マイニング/テキスト分類アルゴリズムはありますか?
data-mining - 2 つの Web ページ間の意味的関係を測定する方法
大学の Web ページにアクセスしているとします。そこにはたくさんの先生のプロフィールがあります。これらのページは構文的に関連していませんが、意味的に関連しています。このタイプの関係をどのように測定できますか? 実際、関係を見つけるためにどのパラメータに焦点を合わせるべきですか?