問題タブ [thai]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1271 参照

python-3.x - Python でタイ語のテキストをトークン化するときの UnicodeDecodeError

Python でディープカットを使用してタイ語のテキストをトークン化しようとしていますが、UnicodeDecodeError が発生しています。

これは私が試したものです

期待される出力:

試した:

適切なトークン化された結果を表示するにはどうすればよいですか、またはタイ語のテキストをトークン化するより良い方法はありますか?