私は立ち往生しています!誰かがこの問題にアイデアを持っているかどうか疑問に思っていました。基本的に、巨大な Web ページにはこの形式の「キー」があります*.*.*
(他のテキストにはこの形式はありません)。
私のテスト スイートは、上記の形式のすべてのキーが辞書リストにあるかどうかを確認することです (既に存在しますが、キーが辞書にない状況が発生する可能性があります)。リストにないキーがある場合、リストにないキーのリストと、それが見つかったページを出力する必要があります。この正規表現を含むすべてのテキストを「grep」する同様の方法はあり*.*.*
ますか?
繰り返しになりますが、これは巨大なサイトであるため、すべてのページをトラバースするのは困難です。ただし、他に方法がない場合は、この形式の文字列のみを取得する方法があります*.*.*
みんなありがとう!