0

重複の可能性:
Ruby で HTML ドキュメントを解析する方法は?

変数の結果にある場合:

<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"/><link             rel="stylesheet" type="text/css" href="http://2.ai/styles/hello.css" media="screen"/><title>Welcome to Dotgeek.org * 1.ai</title></head><body>..... etc

可能であれば、宝石を使用せずに、結果変数にある HTML ページのタイトルを解析するにはどうすればよいですか?

4

2 に答える 2

4
html = '<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"/><link rel="stylesheet" type="text/css" href="http://2.ai/styles/hello.css" media="screen"/><title>Welcome to Dotgeek.org * 1.ai</title></head>'
html.match(/<title>(.*)<\/title>/)[1] #=> "Welcome to Dotgeek.org * 1.ai"
于 2012-09-07T13:41:14.560 に答える
0

次のようにタイトルタグで簡単に分割できます。

title = result.split(/<title>/,2)[1].split(/<\/title>/,2)[0]

(編集: 分割する 2 番目のパラメーターは、Python で慣れていたものとは異なり、分割の数はカウントしませんが、結果の配列内の要素の数をカウントします。つまり、split(/pattern/, 1)実際には何も分割しません...)

于 2012-09-07T13:44:42.613 に答える