問題タブ [tre-library]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - tre ライブラリによる近似一致を使用して複数の正規表現ヒットを検索する
C を使用して、別の親文字列内の部分文字列の一致の場所と数を見つけようとしています。おおよその (ハミング距離) 一致も含める必要があるため、http: //laurikari.net/tre/にある tre ライブラリを使用しています。
サイトのドキュメントの一部を理解するのに苦労しています。おそらく、正規表現の専門用語にあまり慣れていないためです。tre のドキュメントによると、「サブマッチ」に関するより具体的な情報を得ることができます。これらは私が探している一致ですか?
ありがとう!
regex - ファジー正規表現
私の仕事では、ダメラウ・レーベンシュタイン距離などの近似文字列マッチングアルゴリズムを使用して、コードがスペルミスの影響を受けにくくするという素晴らしい結果が得られました。
ここで、文字列をのような単純な正規表現と照合する必要がありますTV Schedule for \d\d (Jan|Feb|Mar|...)
。これは、文字列TV Schedule for 10 Jan
が0をT Schedule for 10. Jan
返し、2を返す必要があることを意味します。
これは、正規表現(この場合は100x12)ですべての文字列を生成し、最適な文字列を見つけることで実行できますが、実用的ではありません。
これを効果的に行う方法について何かアイデアはありますか?
php - PHP からの C ライブラリのロード
最近のプロジェクトでは、lib tre マッチング ライブラリが本当に必要になりました。
ただし、プロジェクトは php であり、ライブラリの php バインディングはありません。
Cライブラリのインターフェイスを作成する方法をグーグルで検索しようとしましたが、見つかったのはdl
php拡張機能のみをロードするように縫い合わせる関数だけでした。
私は何が欠けていますか?
python - TREを使用してPythonで正規表現を近似する:奇妙なUnicodeの動作
スペルミスのある入力を照合するために、python でTREライブラリを使用しようとしています。
utf-8 でエンコードされた文字列を適切に処理することが重要です。
例:
ドイツの首都の名前はベルリンですが、人々が「Bärlin」と書く場合、発音からは同じです。
これまでのところ動作していますが、非 ASCII 文字が検出された文字列の 1 番目または 2 番目の位置にある場合、範囲も検出された文字列自体も正しくありません。
出力
'.*Berlin'
正規表現の場合は正常に機能するわけではありませんが、正規表現の場合は'Berlin'
動作していませんが、
期待どおりに動作します。
エンコーディングに何か問題がありますか? あなたは何かトリックを知っていますか?