問題タブ [aho-corasick]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - TrieではなくDAWGでAho-Corasickを使用する
TrieではなくDAWG(Directed Acyclic Word Graph)で使用されるようにAho-Corasick文字列マッチングアルゴリズムを変更できるかどうか誰かが知っていますか?
algorithm - エイホ-コラシックのスケーラビリティ
キーフレーズのデータベース(ウィキペディアの記事のタイトルから抽出)から、テキストドキュメントでキーフレーズの出現を検索したいと思います。(つまり、ドキュメントがあれば、対応するウィキペディアの記事があるフレーズがあるかどうかを調べたい)Aho-Corasickアルゴリズムについて知りました。何百万ものエントリの辞書用にAho-Corasickオートマトンを構築することが効率的でスケーラブルかどうかを知りたいです。
algorithm - Aho-Corasick と適切な部分文字列
aho-corasick 文字列一致アルゴリズムを理解しようとしています。パターンがabcd
とであるとしbc
ます。このような木になります
点線は故障関数を示しています。
ここで、string をフィードするとしますabcd
。これはツリーに従って「abcd」の一致を検出しますが、私が知る限り、一致bc
は報告されません。アルゴリズムを誤解していますか?
algorithm - Aho-Corasick ハッシュの生成方法
私は最近、オープン ソースのウイルス対策ソフトウェアの開発を開始しましたが、ハッシュは Aho-Corasick アルゴリズムで生成されます。
これに関するインターネット上の情報はほとんど見つからないので、実行可能ファイルから Aho-Corasick ハッシュを生成する方法を知りたいです。
c++ - マルウェア対策コードで使用する Aho-Corasick のようなアルゴリズム
Aho-Corasickのような一連のパターンを同時に照合でき、マルウェア対策の比較に使用できるアルゴリズムはありますか? 既知の市販のウイルス対策ソフトウェアはすべて、Aho-Corasick アルゴリズムを使用していますか?
Boyer-Mooreに対する Aho-Corasick アルゴリズムの利点は何ですか?
php - Aho-Corasick PHP 実装の高速化
PHPでAho–Corasickの実用的な実装はありますか? ウィキペディアの記事で言及されているPHP での Aho-Corasick 文字列マッチングが 1 つあります。
しかし、私はそれを使用するのに苦労しています。赤ちゃんの例では機能しますが、数千のキーワードを読み込もうとすると、スクリプトは読み込みの 30 秒の制限を超えます。
他のスクリプト言語については、Perl 用のhttp://metacpan.org/pod/Text::ScanやPython 用のhttp://pypi.python.org/pypi/ahocorasick/0.9などの素晴らしい実装があります。なぜPHPではないのですか?
c++ - エイホ-コラシックアルゴリズムを使用してクラッシュしますか?
ここでaho-corasickアルゴリズムのコードを入手しました:http ://www.komodia.com/aho-corasick 。
ガイドが言ったようにそれを使用し、線を追加してツリーを構築しました。
ただし、stdwstringからstdstringに変更しましたが、それは問題ではありません。typedefを変更しました。
それを使って何かを探しても、結果が見つからなくても問題ありません。結果が見つかると、標準の範囲外の例外が発生します。
ここでクラッシュします:
ここでクラッシュします:
変数は次のとおりです。
私はこれを使用して、ゲームに検閲を実装しています。
何が原因でクラッシュする可能性がありますか?
いくつかの文字列を2回追加しましたが、問題が発生する可能性がありますか?
ありがとう
algorithm - Aho-Corasick を使用して、指定された文字列セット内のテキストを見つける方法は?
Aho-Corasick アルゴリズムのコードがあります。しかし、特定の文字列リスト内のテキストを検索するときに、検索手順中に状態情報を使用する方法をまだ理解していません。
たとえば、私は文字列のリストを持っていますが、リストにある[MOSCOW][COLA]
かどうかを判断する必要がありCA
ます。リストにある場合、その位置は何ですか?
java - Aho-単語全体のCorasickテキストマッチング?
私はAho-Corasickテキストマッチングを使用していますが、文字ではなく用語に一致するように変更できるかどうか疑問に思っています。言い換えれば、私は用語が文字ではなくマッチングの基礎になることを望んでいます。例として:
検索クエリ:「彼」、
文:「Helloworld」、
Aho-Corasickは、「he」をインデックス2で終わる「helloworld」という文に一致させますが、一致させたくありません。つまり、文字ではなく「用語」という言葉を意味します。
c++ - Aho-Corasick アルゴリズム
このコードの間違いを見つけるのを手伝ってください。Aho-Corasick アルゴリズムで n 個の文字列を追加して試行する簡単なプログラムを書きましたが、正しく動作しません。文字列を入力するとクラッシュします。このコードの何が問題なのですか?