html - Windows - html ファイルを grep (または findstr) し、最初に一致した式を表示する方法

翻译自：https://stackoverflow.com/questions/17150964 2013-06-17T15:13:55.880

1347 次

grep または findstr を使用して、特定の映画を本名で検索するときに、正しい IMDB 番号を取得したいと考えています。

たとえば、映画「Das Boot」は映画番号 tt0082096 で IMDB に登録されています。

実際、検索マシンによって生成された html ファイルを grep (または findstr) しようとしています。

生成された html ファイルには、次のようないくつかの部分が含まれています。

<div id="statbox"> 
  <span class="uschr2">1. </span> <a href="http://www.imdb.com/title/tt0082096/" class="dublaulink">Das Boot (1981) - IMDb</a> <br>
  <div id="descbox"> 
  www.imdb.com/title/tt0082096/ - Im Cache - Ähnliche Seiten <BR>
  </div>

私が探している文字列は、映画の URL を含む文字列です。この場合は次のとおりです。

http://www.imdb.com/title/tt0082096/

文字列形式は次のようになります。

http://www.imdb.com/title/tt???????/

どこ '？' 数字 0...9 を表します

私の質問は次のとおりです: grep または findstr は、一致を含む完全な行ではなく、一致する文字列自体の最初の出現のみを返すにはどうすればよいですか?

ご協力ありがとうございました！よろしくお願いします

html - Windows - html ファイルを grep (または findstr) し、最初に一致した式を表示する方法

2 に答える 2

Related

Reference