0

クラウド NL を使用して Google Speech のテキストを分析していますが、たとえば短縮形のトークン化に問題があるようです

"あなたのことが好きではありません"

content_text が次のトークンとして返されます。

"あなたのことが好きではありません"

引用符をエスケープしても役に立ちませんでした。この場合、次のように戻ってきました

"あなたのことが好きではありません"

しかし、aposのdoとトークンを削除するとわかりました

あなたのことが好きではありません

動詞として「dont」で戻ってきた(十分に正しい)

これは今のところ正しい回避策ですか?

4

0 に答える 0