1

この Web ページ(以下のサンプル xml)のすべてのデータを反復処理していますが、必要な値を正確に取得する方法について混乱しています。

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet title="XSL_formatting" type="text/xsl" href="/i/xml/xsl_formatting_rss.xml"?>
<rss xmlns:blogChannel="http://backend.userland.com/blogChannelModule" version="2.0">
    <channel>
        <title>Ariana Resources News</title>
        <link>http://www.iii.co.uk/investment/detail?code=cotn:AAU.L&amp;display=news</link>
        <description />
    <item>
        <title>Ariana Resources PLC - Environmental Impact Assessment Submitted for Kiziltepe</title>
        <link>http://www.iii.co.uk/investment/detail?code=cotn:AAU.L&amp;display=news&amp;action=article&amp;articleid=9084833&amp;from=rss</link>
        <description>Some Article information</description>
        <pubDate>Fri, 30 Aug 2013 07:00:00 GMT</pubDate>
    </item>
    <item>
        <title>Ariana Resources PLC - Directors' Dealings and Holding in Company</title>
        <link>http://www.iii.co.uk/investment/detail?code=cotn:AAU.L&amp;display=news&amp;action=article&amp;articleid=9053338&amp;from=rss</link>
        <description>Some Article information</description>
        <pubDate>Wed, 31 Jul 2013 07:00:00 GMT</pubDate>
    </item>
    <item>
        <title>Ariana Resources PLC - Directorship Changes</title>
        <link>http://www.iii.co.uk/investment/detail?code=cotn:AAU.L&amp;display=news&amp;action=article&amp;articleid=9046582&amp;from=rss</link>
        <description>Some Article information</description>
        <pubDate>Wed, 24 Jul 2013 09:31:00 GMT</pubDate>
    </item>
    <item>
        <title>Ariana Resources PLC - Ariana Resources plc : Capital Reorganisation</title>
        <link>http://www.iii.co.uk/investment/detail?code=cotn:AAU.L&amp;display=news&amp;action=article&amp;articleid=9038706&amp;from=rss</link>
        <description>Some Article information</description>
        <pubDate>Wed, 24 Jul 2013 09:31:00 GMT</pubDate>
    </item>
    <item>
</channel>
</rss>

私はdom4jクイックスタートガイドを見てきましたが、私はそれをよく理解していないと思います.

次のような方法で反復するにはどうすればよいですか。

  1. 今日の日付があり、...
  2. それぞれの specificall の値を取得し、

この時点で、私は以下を手に入れました.2番目のループでは非常に間違っていると思います...どんな助けも大歓迎です:

    //Create a null Document Object
    Document theXML = null;

    //Get the document of the XML and assign to Document object
    theXML = parseXML(url);

    //Place the root element of theXML into a variable
    Element root = theXML.getRootElement();


    // iterate through child elements of root
    for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
        Element element = (Element) i.next();
        // do something

        // iterate through child elements of root with element name "item"
        for ( Iterator j = root.elementIterator( "item" ); j.hasNext(); ) {
            Element foo = (Element) j.next();

            String rnsHeadline = "";
            String rnsLink = "";
            String rnsFullText = "";
            String rnsConstituentName = "";



            Rns rns = new Rns(null, null, null, null);

        }
4

2 に答える 2

0

2 番目のループに問題はありません。要素階層をナビゲートして、関心のある に到達する必要があるため、すでに正しい道を進んでいます。そして、これがあなたが続ける方法です:

public class Dom4JRssParser {

    private void parse(Date day) throws DocumentException, ParseException {
        Date dayOnly = removeTime(day);

        // Fri, 30 Aug 2013 07:00:00 GMT
        SimpleDateFormat sdfXml = new SimpleDateFormat("EEE, dd MMM yyyy HH:mm:ss z", Locale.ENGLISH);
        System.out.println("Day: " + sdfXml.format(dayOnly));

        SAXReader reader = new SAXReader();
        Document doc = reader.read(getClass().getResourceAsStream("/com/so/dom4j/parser/rss/example_01.xml"));
        Element root = doc.getRootElement(); // rss
        for(Iterator rootIt = root.elementIterator("channel"); rootIt.hasNext(); ) {
            Element channel = (Element) rootIt.next();
            for(Iterator itemIt = channel.elementIterator("item"); itemIt.hasNext(); ) {
                Element item = (Element) itemIt.next();
                Element pubDate = item.element("pubDate");
                if(pubDate != null) {
                    if(removeTime(sdfXml.parse(pubDate.getTextTrim())).equals(dayOnly)) {
                        Rns rns = new Rns(item.element("title"), 
                                item.element("link"), 
                                item.element("description"), 
                                item.element("constituent"));
                        System.out.println(rns.toString());
                        System.out.println();
                    }
                }
            }
        }
    }

    private Date removeTime(Date day) {
        Calendar c = Calendar.getInstance(Locale.ENGLISH);
        c.setTime(day);
        c.set(Calendar.HOUR_OF_DAY, 0);
        c.set(Calendar.MINUTE, 0);
        c.set(Calendar.SECOND, 0);
        c.set(Calendar.MILLISECOND, 0);
        return c.getTime();
    }

    public static void main(String... args) throws ParseException, DocumentException {
        Dom4JRssParser o = new Dom4JRssParser();
        if(args.length == 0) {
            o.parse(new Date());
        } else {
            SimpleDateFormat sdfInput = new SimpleDateFormat("yyyyMMdd");
            for(String arg : args) {
                o.parse(sdfInput.parse(arg));
            }
        }
    }
}

引数を指定してテスト実行

20130731

出力

Day: Wed, 31 Jul 2013 00:00:00 CEST
Rns [rnsHeadline=Ariana Resources PLC - Directors' Dealings and Holding in Company
rnsLink=http://www.iii.co.uk/investment/detail?code=cotn:AAU.L&display=news&action=article&articleid=9053338&from=rss
rnsFullText=Some Article information
rnsConstituentName=]

また、より快適なXPath API (投稿したクイックスタート リンクのセクション) の使用を検討することもできPowerful Navigation with XPathます。eis の回答を参照してください。

于 2013-09-07T14:56:04.907 に答える