54

最初に、この質問を確認しましたが、答えは廃止されたサービスに関するものです。

では、正規表現でインターネットコンテンツを検索できるWebベース(またはソフトウェア、私は気にしない)はありますか?

4

5 に答える 5

21

著者との完全な連帯のために、ここに superuser.com の質問からの回答を書きましょう。

Ask Metafilterからの引用:

キーワード検索を数百テラバイト (または最近のインデックスが何であれ) にわたって効率的にする唯一の方法は、単語のインデックスを事前に計算することです。

実際、完全な正規表現エンジンはチューリング完全であり、ほぼ無限の CPU 時間とメモリをむさぼり食う任意の正規表現を作成できます。これらすべての理由から、彼らが正規表現検索を一般大衆に提供することは技術的に狂気です。

更新:正しく指摘されているように、regexp はチューリング完全ではありません。より詳細な回答をお待ちください:

未定...

于 2012-06-20T12:09:27.027 に答える
2

正規表現エンジンによるインスタント検索はありません。これは、ページのインデックス作成方法が原因である可能性があります。Webをgrepできるようにすると、多くの計算能力が必要になります。

于 2012-06-20T12:15:11.077 に答える
2

dayyan は正しいです。検索エンジンを高速化するのは逆インデックスです。フラッシュ ディスクが 100 テラバイトしかない場合、ペタバイトのコンテンツを超える正規表現検索を高速化する方法はありません。キーワード検索、逆索引、問題ありません。

blekko の Web grep (https://blekko.com/ws/+/webgrep) は正規表現をサポートしていますが、検索のほとんどは定数文字列に対するもので、通常は HTML に含まれています。 ? さまざまな JavaScript ライブラリを使用しているのは誰ですか? さまざまなコメント システムを使用するのは誰ですか? などなど。

正規表現を送っていただければ、喜んで実行させていただきます。

これらの検索の実行は、クロール内のすべての html に対して実行される MapReduce ジョブで構成されます。そのため、回答を得るまでに時間がかかります (1 日または 2 日)。

于 2012-06-23T03:05:58.747 に答える
0

完全な正規表現検索を使用するサイトを見つけることはほとんどありませんが、Google にはマッチングを行う機能がいくつかあります。達成しようとしていることに応じて、これで十分かもしれません。

GoogleGuideは、利用可能なオプションのいくつかをかなり詳しく説明しているようです。検索したい種類のクエリの例を挙げていただければ、解決策を見つけることができるでしょうか?

于 2012-06-20T12:19:54.367 に答える
0

正規表現である必要がある場合は、あなたはうんざりしていると思います。ただし、より高度な検索機能をお探しの場合は、http://www.googleguide.com/advanced_operators_reference.htmlをご覧ください。

于 2012-06-21T16:26:27.293 に答える