0

ページに記事があり、すべてのテキストを解析する必要があります。

記事は 15 語以上で、記号「 」、「,」、「-」、「:」、または「.」で結合されていることを知っています。

ページ上の記事を分析して解析するために Ruby で正規表現を作成するにはどうすればよいですか?

たとえば、これ: http://www.nytimes.com/2013/06/20/sports/baseball/for-the-mets-an-afterglow-then-realitys-harsh-light.html?ref=sports&_r=0

本文を解析する必要があります。ATLANTA — From the sublime emotional high provided by Matt Harvey and Zack Wheeler, the Mets’ young, hard-throwing right-handers, the team on Wednesday descended back to the realities of its everyday existence...

ページのコンテンツを解析して取得する方法は知っていますが、正規表現に書き込む方法がわかりません! 必要なテキストを含む親 HTML タグを分析するには、いくつかの正規表現を記述してルールをチェックする必要があります: article は 15 語以上で、記号 ' '、','、'-'、':'、または '.' のみで結合されています。

4

1 に答える 1