会社名と電話番号、住所、電子メールなどの詳細のリストがあります。company_url を取得したい。Google API を使用してリクエストを行うことを考えましたが、コストがかかることがわかりました。
検索した後、ウェブサイトのダムデータに関して、Googleにやや近い Common_Crawl を見つけました。
私たちの電話番号を Common_Crawl で利用可能な電話番号に実際にマップするWeb サイトを見つけました。
会社名を使用してそれらを一致させる方法を見つける必要があります。
Common_crawl データを使用して会社名でマッピングできる方法はありますか。会社名ごとに 32 億 5000 万個の common_crawl レコードを調べたくありません。