0

特定の Web サイトから会社名を抽出するために AlchemyAPI をテストしています。ほとんどの場合、正しい情報を得ることができます。また、結果をビジネスに分類する必要があります。AlchemyAPI から得られるのは最も一般的な分類ですが、より具体的な回答が必要です。たとえば、デモ リンクで www.ford.com と入力すると、カテゴリがレクリエーションとして返されます。DMOZ はフォードを最高レベルの娯楽として分類しています。フォードをビジネス車として分類する必要があります。これを行う方法はありますか?AlchemyAPI は DMOZ を使用して分類しますか? もしそうなら、より具体的な分類を達成する方法は?

別の例はペプシです。ペプシコはビジネスに分類されます。ビジネス --> 食品および飲料に分類する必要があります。

4

2 に答える 2

0

AlchemyAPI のランク付けされた名前付きエンティティの抽出は、名前付きエンティティを分類し、曖昧さ回避を有効にすると、より具体的な分類が提供されます (つまり、Ford = Company -> AutomobileCompany)。

于 2013-08-22T20:19:31.180 に答える
0

AlchemyAPIのテキスト分類エンドポイントを使用しているようです。この呼び出しは、ドキュメント全体を 12 のカテゴリのうちの 1 つに分類しようとします (「ビジネス」と「レクリエーション」はそのうちの 2 つです)。

テキスト分類の呼び出しは、「このドキュメントは一般的に X に関するものです」と言うことが意図されています。ドキュメントから特定の会社名を抽出し、その会社が属しているカテゴリを把握したい場合は、エンティティ抽出呼び出しを使用してみてください (詳細: http://www.alchemyapi.com/api/entity-extraction/ )。この呼び出しにより、ドキュメント内のすべての会社が検索され、各会社の「タイプ」が返されます。他の呼び出しの 12 のカテゴリの代わりに、エンティティ抽出呼び出しは数百の種類をサポートします。これにより、分類の精度が向上するはずです。

于 2013-08-08T15:02:55.077 に答える