android - 特定のコンテキストに合わせた Google Cloud Natural Language API のカスタマイズ

Question

Google のクラウド Speech API と Natural Language API を利用するデモアプリを作成しています。テレビやSTBの音声操作に使用しています。

全体として、API はうまく機能していると言わざるを得ません。

ただし、Natural Language API をカスタマイズして、この業界でより具体的にすることができるかどうかは疑問です。

具体的には、特定のエンティティに渡される顕著性スコアに問題がありました。

たとえば、次のテキストデータを Google Cloud API に渡します: 「ズーランダーのような映画を見せて」

次の結果が得られます。

エンティティ名 | エンティティタイプ | メタデータ | 顕著性

映画 | WORK_OF_ART | {} | 0.7970062 ズーランダー | WORK_OF_ART | {'mid': '/m/01shy7', 'wikipedia_url': ' https://en.wikipedia.org/wiki/Zoolander '} | 0.20299383

エンティティズーランダーは、文中で最も重要なエンティティであるにもかかわらず、顕著性が非常に低いです...

それを改善する方法はありますか？または、カスタマイズできるその他の Natural Language API はありますか?

score 0 · Accepted Answer

Google は独自のデータを使用して機械学習モデルをトレーニングしており、カスタマイズするオプションがないため、API の結果を改善する方法はありません。

カスタムモデルを持つ唯一の方法は、たとえばAutoMLを使用して、自分でトレーニングすることです。しかし、これには多くの努力が必要です。

コンテキストに基づいて結果を「条件付け」する機能要求を提出することができます(または私が行うこともできます)。これは、テキスト上の単語の関連性だけを考慮するのではなく、何らかの形で顕著性スコアに影響を与える可能性があります。

とにかく、最初と 2 番目の結果の間に重要な顕著な違いがあるため、これは必要ないかもしれません。salience scoresの代わりに違いを使用しようとしましたsalience absolute valueか? または、特定の「タイプ」の結果 (WORK_OF_ARTこの場合)のスコア乗数?

この解決策は、ある種の文では機能するが、他の文では機能しないことを認識しています。

android - 特定のコンテキストに合わせた Google Cloud Natural Language API のカスタマイズ

2 に答える 2

Related

Reference