1

XMLライブラリでの使用中に問題が発生したのはこれが初めてではありませんが、過去には、必要なものを解析するためにhtmlParseを使用して諦めました。誰もが知っているように、regexはパーサーではないので、XML/XHTMLを解析することでそれを行いたいと思います。

とはいえ、解析コマンドからのエラーメッセージはせいぜい役に立たないことがわかり、どのように進めるかがわかりません。例えば:

> htmlParse(getForm("http://www.takecarehealth.com/LocationSearchResults.aspx", location_query="Deer Park",location_distance=50))
Error in htmlParse(getForm("http://www.takecarehealth.com/LocationSearchResults.aspx",  : 
  File 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head id="ctl00_Head1">
        <title></title>
        <script language="JavaScript" type="text/javascript">
            var s_pageName = document.title;
            var s_channel = "Take Care";
            var s_campaign = "";
            var s_eVar1 = ""
            var s_eVar2 = ""
            var s_eVar22 = ""
            var s_eVar23 = ""
        </script>
        <meta name="keywords" content="take care clinic, walgreens clinic, walgreens take care clinic, take care health, urgent care clinic, walk in clinic" />
        <meta name="description" content="Information about simple, quality healthcare for the whole family from Take Care Clinics at select Walgreens, including Take Care Clinic hours, providers, offers, insurance and quality of care." />
        <link rel="shortcut icon" hre

そこに何かが表示されてうれしいですが、「エラー:ファイル」を超えてドリルダウンするにはどうすればよいですか?

これは、私が知る限り、整形式のXHTMLであることに注意してください。リンクに手動でアクセスすると、xpathを実行できますが、Firebugは文句を言いません。

このようにhtmlParseからエラーをデバッグするにはどうすればよいですか?

4

1 に答える 1

3

最初にダウンロードしてからXMLパッケージに渡すとうまくいくようです

test<-getForm("http://www.takecarehealth.com/LocationSearchResults.aspx", location_query="Deer Park",location_distance=50)
htmlParse(test,asText=T)

または直接

htmlParse(getForm("http://www.takecarehealth.com/LocationSearchResults.aspx", location_query="Deer Park",location_distance=50),asText=T)

また元気そうです

于 2012-07-29T20:03:21.407 に答える