問題タブ [french]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - findall() で生成された単語リストにフランス語、スペイン語、およびドイツ語の文字がありません
collections.counter() および findall() 関数を使用して、.txt ファイル (65000 語) から単語リストを作成しています。英語によく効きます。ただし、â、á、ü、ö などの他の言語の特殊文字は無視されます。さらに、「t'appele」や「signifie-t-elle」などの単語を組み合わせて、1 つの別個の単語として追加したいと考えています。私はあらゆる種類の正規表現の組み合わせを試しましたが、成功しませんでした。誰かが特殊文字を含める方法を知っていますか? 以下は私のコードです。