0

法人名に従ってデータを正規化し、レコードをリンクしようとしています。

正式な商号とその会社に関する一般情報はどこで確認できますか? 次の少なくとも 1 つを持っています: 株式記号、DBA (短い名前)、DNS 名、または完全な正式名。

これまでのところ、私は

  • whois に頼ると、プライベートな情報や古い情報が得られる
  • Wolfram Alpha API は公開企業に必要なもののほとんどを提供してくれますが、LEGO のような非公開企業には何も役に立ちません
  • (c) 記号の Web ページを解析すると、解決プロセスに役立つ場合がありますが、名前を信頼できるリストに一致させることはできません。

すべての銘柄記号が分類されているため。それは簡単です。

海外にある可能性のある非公開または非営利事業の DBA (短縮名)、DNS 名、または完全な正式名を変換、正規化、および検証するにはどうすればよいですか?

(例: DBA として MET Museum、サイトとして metmuseum.org、または「Metropolitan Museum of Art」の正式名称)

4

2 に答える 2

1

私はこの分野でいくつかの調査を行っており、組織名を抽出し、(クラスタリングを介して) 発見し、(強化された編集距離計算により) 正規化するアプローチについて説明している最近の論文を見つけました。ニモ

于 2013-06-12T13:40:22.163 に答える
1

ここがあなたの質問をするのに最適な場所かどうかわかりません。地元の図書館員が助けてくれるかもしれません。とにかく、私は過去にこれらの方針に沿って多くの作業を行ってきたので、また、プログラマーやデータベース設計者はデータ (特に信頼できる標準データ) を見つける場所を知っていることが多いため、回答しています。

地方レベル (米国) では、地元の商工会議所から提供されたものは何でも受け入れました。国レベルでは、InfoUSAからリストを購入しました。商工会議所のデータは非常に不安定な場合があります。InfoUSA のデータは非常にクリーンです。

Dun & Bradstreetは、私が知る限り、ワンストップのグローバル ビジネス レジストリに最も近いものです。彼らは安くはありません。

イギリスのRBAという会社は、グローバルな視点で本当に役立つ紹介をしているようです。公式の会社登記簿を参照してください。そこにあるデータの多くは無料です。

于 2011-01-29T08:16:33.117 に答える