問題タブ [re]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1388 問題

0 投票する

0 に答える

160 参照

python - 大きな Unicode テキスト用の Python finditer または sub

複数のトークンを大きな Unicode テキストドキュメントに置き換える必要があります。現在、私は自分の辞書の単語を反復処理しておりsub、コンパイルされた正規表現に置き換えています:

私の単語の正規表現はどこですか

これは、新しい正規表現をコンパイルする必要がありsub、ドキュメントに存在するかどうかにかかわらず、すべてのトークンに対して呼び出しが発生することを意味しますtext。別のアプローチとして、トークンの出現を見つけて、トークンが見つかった場合re.finditerに呼び出すことができます。re.sub

re.subしたがって、実際には必要ないときの呼び出しを回避します。re.finditer最後のアプローチは、グループの結果を使用して改善できます。

これらのうち、どれがより速いアプローチですか？

2019-05-06T19:39:45.970

1 2 3 4 5 6 7 8 9 10

問題タブ [re]

python - 大きな Unicode テキスト用の Python finditer または sub

Reference