0

私たちは、特定の基準を持つ全国の小売業者の非常に包括的なデータベースをまとめました. リストをまとめるには、電話インタビューなどで1年以上かかりました。もちろん、このリストはフラット ファイルとしてダウンロードできるように、私たちのサイトで公開されているわけではありません。

ただし、すべてのコンテンツは Google マップを介してサイトで検索できます。したがって、理論的には、十分な数の郵便番号を検索すれば、誰かが最終的にすべての小売業者のデータを入手できる可能性があります。もちろん、私たちのモデル全体は、このデータベースをコンパイルし、サイトで消費するためにエンドユーザーに提供するために必要な調査とインタビューを行うことであるため、それは望んでいません.

したがって、データが大量に取得されるのを防ぐ方法は実際にはなく、競合する可能性のある Web サイトがあるという結論に達しました。しかし、データに透かしを入れる方法はありますか? Lat/Lon はデータベースで事前に計算されているため、住所が 100% 正しい必要はありません。たとえば、「1776 3rd St」を「1776 Third Street」に置き換えるか、標準文字を Unicode 置換に置き換えることを考えています。このように、このデータが競合するサイトで正確に見つかった場合、それが盗作であることがわかります. 欠点は、ユーザーが変更した住所を自分の Google マップのインスタンスにカット アンド ペーストしようとした場合です。場合によっては、変更によってそれが困難になることがあります。

貴重なコンテンツをオープンに配布している他の Web サイトは、この課題にどのように取り組んでいますか? 助言がありますか?

ありがとう

4

1 に答える 1

1

私に言わせれば、「公然と配布する」か「公然と配布しない」かという問題です。本当に配布したい場合は、誰かがデータを受信できることを認める必要があります。

特定の種類のデータ(写真、映画などのメディア)を使用すると、透かしを入れたり、データを改ざんして追跡できるようにすることができますが、コンテンツが自分のコンテンツに似ている場合は、防御がさらに困難になります。サードストリート」と他の誰かもそれを使用しています、あなたは彼らに対して訴訟を起こすことができると思いますか?私はそれを非常に疑っています。

私が考えることができる唯一のステップは

  • すべての情報を取得するのが難しくなります。Googleマップに配置するのではなく、スクリプトなどの背後に隠し、ボットが情報を取得できるようにするのが難しいことを確認し、1人のユーザーに表示される結果の量を制限するなど。サービスはエンドユーザーにとってあまり魅力的ではありません。これはトレードオフです。

  • 上記の逆のようなものです。一般ユーザーに表示するのではなく、同じ手法を使用してデータの一部を非表示にします。これは偽のデータであり、通常の人には見られないはずです。これらの小売業者が競合他社に現れた場合、あなたは彼らを赤字で捕まえています。これは確かに絶対確実ではありません。結果の有効性を確認して偽物を削除できるため、奇妙なシステムを使用しているユーザーが偽のデータを取得して、提供されるコンテンツの正確性を低下させる可能性が常にあります。 'スクレーパーは実際のユーザーに非常に似ているため、データを取得できません。

  • 2ステップの情報を提供します。ステップ1で「概要」情報を取得すると、誰でもそれを見つけることができます。ステップ2では、これがユーザーが望んでいるものであることを確認した後、ログイン、リクエストの制限など、すべてを提供します。したがって、ユーザーがアクセスしやすい小売業者を検索する場合は、まずどの地域にあるかを言って、地図上に「大まかに」表示します。ユーザーが何かを選択した場合は、限られた環境で実際の情報を表示します。 。

于 2012-06-13T15:01:58.010 に答える