1

Google のクラウド Speech API と Natural Language API を利用するデモ アプリを作成しています。テレビやSTBの音声操作に使用しています。

全体として、API はうまく機能していると言わざるを得ません。

ただし、Natural Language API をカスタマイズして、この業界でより具体的にすることができるかどうかは疑問です。

具体的には、特定のエンティティに渡される顕著性スコアに問題がありました。

たとえば、次のテキスト データを Google Cloud API に渡します: 「ズーランダーのような映画を見せて」

次の結果が得られます。

エンティティ名 | エンティティ タイプ | メタデータ | 顕著性

映画 | WORK_OF_ART | {} | 0.7970062 ズーランダー | WORK_OF_ART | {'mid': '/m/01shy7', 'wikipedia_url': ' https://en.wikipedia.org/wiki/Zoolander '} | 0.20299383

エンティティ ズーランダーは、文中で最も重要なエンティティであるにもかかわらず、顕著性が非常に低いです...

それを改善する方法はありますか?または、カスタマイズできるその他の Natural Language API はありますか?

4

2 に答える 2

0

Google は独自のデータを使用して機械学習モデルをトレーニングしており、カスタマイズするオプションがないため、API の結果を改善する方法はありません。

カスタム モデルを持つ唯一の方法は、たとえばAutoMLを使用して、自分でトレーニングすることです。しかし、これには多くの努力が必要です。

コンテキストに基づいて結果を「条件付け」する機能要求を提出することができます(または私が行うこともできます)。これは、テキスト上の単語の関連性だけを考慮するのではなく、何らかの形で顕著性スコアに影響を与える可能性があります。

とにかく、最初と 2 番目の結果の間に重要な顕著な違いがあるため、これは必要ないかもしれません。salience scoresの代わりに違いを使用しようとしましたsalience absolute valueか? または、特定の「タイプ」の結果 (WORK_OF_ARTこの場合)のスコア乗数?

この解決策は、ある種の文では機能するが、他の文では機能しないことを認識しています。

于 2018-07-07T15:44:19.927 に答える