問題タブ [chardet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
526 参照

python - chardet.detect 空の言語を返す

ここで提案されているソリューションの1つのように、文字列の言語を検出するために chardet.detect を使用しています

私のコードは次のようになります。

私が得た結果は次のようになります。

私の期待される結果は次のようになります。

アプリケーションに既にインポートしているため、解決策として chardet を使用することを好み、できるだけスリムに保ちたい

0 投票する
1 に答える
135 参照

python - Python: 大きなバイナリ オブジェクトを使用した chardet.detect

Web ページからいくつかの大きなファイルを取得します。それらはバイナリです。chardet.detect ではスクリプトが遅すぎるため、それらをスキャンしてエンコードを検出する必要があります。readline を使おうと思ったのですが、バイナリしか持っていないので使えません。バイナリオブジェクトで readline のようなことをすることは可能ですか?