Google のクラウド Speech API と Natural Language API を利用するデモ アプリを作成しています。テレビやSTBの音声操作に使用しています。
全体として、API はうまく機能していると言わざるを得ません。
ただし、Natural Language API をカスタマイズして、この業界でより具体的にすることができるかどうかは疑問です。
具体的には、特定のエンティティに渡される顕著性スコアに問題がありました。
たとえば、次のテキスト データを Google Cloud API に渡します: 「ズーランダーのような映画を見せて」
次の結果が得られます。
エンティティ名 | エンティティ タイプ | メタデータ | 顕著性
映画 | WORK_OF_ART | {} | 0.7970062 ズーランダー | WORK_OF_ART | {'mid': '/m/01shy7', 'wikipedia_url': ' https://en.wikipedia.org/wiki/Zoolander '} | 0.20299383
エンティティ ズーランダーは、文中で最も重要なエンティティであるにもかかわらず、顕著性が非常に低いです...
それを改善する方法はありますか?または、カスタマイズできるその他の Natural Language API はありますか?