google-cloud-nl - Google Natural Language の短縮形

翻译自：https://stackoverflow.com/questions/44913766 2017-07-04T20:43:05.410

50 次

クラウド NL を使用して Google Speech のテキストを分析していますが、たとえば短縮形のトークン化に問題があるようです

"あなたのことが好きではありません"

content_text が次のトークンとして返されます。

"あなたのことが好きではありません"

引用符をエスケープしても役に立ちませんでした。この場合、次のように戻ってきました

"あなたのことが好きではありません"

しかし、aposのdoとトークンを削除するとわかりました

あなたのことが好きではありません

動詞として「dont」で戻ってきた（十分に正しい）

これは今のところ正しい回避策ですか？

0 に答える 0