問題タブ [aho-corasick]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1252 参照

java - TrieではなくDAWGでAho-Corasickを使用する

TrieではなくDAWG(Directed Acyclic Word Graph)で使用されるようにAho-Corasick文字列マッチングアルゴリズムを変更できるかどうか誰かが知っていますか?

0 投票する
4 に答える
3571 参照

algorithm - エイホ-コラシックのスケーラビリティ

キーフレーズのデータ​​ベース(ウィキペディアの記事のタイトルから抽出)から、テキストドキュメントでキーフレーズの出現を検索したいと思います。(つまり、ドキュメントがあれば、対応するウィキペディアの記事があるフレーズがあるかどうかを調べたい)Aho-Corasickアルゴリズムについて知りました。何百万ものエントリの辞書用にAho-Corasickオートマトンを構築することが効率的でスケーラブルかどうかを知りたいです。

0 投票する
3 に答える
2672 参照

algorithm - Aho-Corasick と適切な部分文字列

aho-corasick 文字列一致アルゴリズムを理解しようとしています。パターンがabcdとであるとしbcます。このような木になります

点線は故障関数を示しています。

ここで、string をフィードするとしますabcd。これはツリーに従って「abcd」の一致を検出しますが、私が知る限り、一致bcは報告されません。アルゴリズムを誤解していますか?

0 投票する
1 に答える
508 参照

algorithm - Aho-Corasick ハッシュの生成方法

私は最近、オープン ソースのウイルス対策ソフトウェアの開発を開始しましたが、ハッシュは Aho-Corasick アルゴリズムで生成されます。

これに関するインターネット上の情報はほとんど見つからないので、実行可能ファイルから Aho-Corasick ハッシュを生成する方法を知りたいです。

0 投票する
1 に答える
1668 参照

c++ - マルウェア対策コードで使用する Aho-Corasick のようなアルゴリズム

Aho-Corasickのような一連のパターンを同時に照合でき、マルウェア対策の比較に使用できるアルゴリズムはありますか? 既知の市販のウイルス対策ソフトウェアはすべて、Aho-Corasick アルゴリズムを使用していますか?

Boyer-Mooreに対する Aho-Corasick アルゴリズムの利点は何ですか?

0 投票する
4 に答える
2285 参照

php - Aho-Corasick PHP 実装の高速化

PHPでAho–Corasickの実用的な実装はありますか? ウィキペディアの記事で言及されているPHP での Aho-Corasick 文字列マッチングが 1 つあります。

しかし、私はそれを使用するのに苦労しています。赤ちゃんの例では機能しますが、数千のキーワードを読み込もうとすると、スクリプトは読み込みの 30 秒の制限を超えます。

他のスクリプト言語については、Perl 用のhttp://metacpan.org/pod/Text::ScanやPython 用のhttp://pypi.python.org/pypi/ahocorasick/0.9などの素晴らしい実装があります。なぜPHPではないのですか?

0 投票する
1 に答える
311 参照

c++ - エイホ-コラシックアルゴリズムを使用してクラッシュしますか?

ここでaho-corasickアルゴリズムのコードを入手しました:http ://www.komodia.com/aho-corasick 。

ガイドが言ったようにそれを使用し、線を追加してツリーを構築しました。

ただし、stdwstringからstdstringに変更しましたが、それは問題ではありません。typedefを変更しました。

それを使って何かを探しても、結果が見つからなくても問題ありません。結果が見つかると、標準の範囲外の例外が発生します。

ここでクラッシュします:

ここでクラッシュします:

変数は次のとおりです。

ここに画像の説明を入力してください

私はこれを使用して、ゲームに検閲を実装しています。

何が原因でクラッシュする可能性がありますか?

いくつかの文字列を2回追加しましたが、問題が発生する可能性がありますか?

ありがとう

0 投票する
1 に答える
1068 参照

algorithm - Aho-Corasick を使用して、指定された文字列セット内のテキストを見つける方法は?

Aho-Corasick アルゴリズムのコードがあります。しかし、特定の文字列リスト内のテキストを検索するときに、検索手順中に状態情報を使用する方法をまだ理解していません。

たとえば、私は文字列のリストを持っていますが、リストにある[MOSCOW][COLA]かどうかを判断する必要がありCAます。リストにある場合、その位置は何ですか?

ここにコードへのリンクがあります

0 投票する
4 に答える
2389 参照

java - Aho-単語全体のCorasickテキストマッチング?

私はAho-Corasickテキストマッチングを使用していますが、文字ではなく用語に一致するように変更できるかどうか疑問に思っています。言い換えれば、私は用語が文字ではなくマッチングの基礎になることを望んでいます。例として:

検索クエリ:「彼」、

文:「Helloworld」、

Aho-Corasickは、「he」をインデックス2で終わる「helloworld」という文に一致させますが、一致させたくありません。つまり、文字ではなく「用語」という言葉を意味します。

0 投票する
1 に答える
1106 参照

c++ - Aho-Corasick アルゴリズム

このコードの間違いを見つけるのを手伝ってください。Aho-Corasick アルゴリズムで n 個の文字列を追加して試行する簡単なプログラムを書きましたが、正しく動作しません。文字列を入力するとクラッシュします。このコードの何が問題なのですか?