2

私は最近、オンライン XML フィードからリソース データ キャプチャ レコードを作成するためのスクリプト ソリューションの作成を任されました。

これは私が以前に行ったことではありません。誰かが私が知っておくべき重要なポイント、私が見ることができる背景の読み物、または私が取り入れるべき他の問題や「落とし穴」を提供してくれるとありがたいです.これを行う際の考慮事項。このタイプのタスクに固有の用語も大きな助けになります。

理想的には、JQuery を使用してこれを実現したいと考えています。または、それがより簡単なタスクである場合は、Perl を使用してください。ただし、私の JQuery の知識は Perl の知識よりも優れています。

私の目的は、さまざまなコンテンツで構成される複数のノード要素で構成される非常に大きな XML フィードをオンラインから取得することです。XML の例を以下に示します。

<response>
<result name="response" numFound="3559" start="0">
    <doc>
        <str name="PID">islandora:4466</str>
        <arr name="dc.coverage">
            <str>4466</str>
        </arr>
        <arr name="dc.description">
            <str>
                Text
            </str>
            <str>
                <p><iframe src="http:" width="230" height="230" frameborder="0" allowtransparency="65535" scrolling="auto"></iframe></p>
                <p><a href="/assets/.....">Transcript (DOC, 150KB)  </a></p>
            </str>
        </arr>
        <arr name="dc.identifier">
            <str>islandora:4466</str>
        </arr>
        <arr name="dc.subject">
            <str>heav422</str>
            <str>heav533</str>
            <str>heav547</str>
            <str>heav549</str>
            <str>discipline1137</str>
            <str>theme778</str>
        </arr>
        <str name="dc.title">Text</str>
        <arr name="hea.abstract">
            <str> <!-- HTML ready content (example below) -->
                <p>Text</p>
                    <ul>
                        <li>Text</li>
                        <li>Text</li>
                        <li>Text</li>
                        <li>Text</li>
                        <li>Text</li>
                        <li>Text</li>
                        <li>Text</li>
                    </ul>
                <p>Text</p>
            </str>
        </arr>
        <arr name="hea.date">
            <str>2012-05-01 00:00:00</str>
        </arr>
        <arr name="hea.discipline">
            <str>1137</str>
        </arr>
        <arr name="hea.heav">
            <str>422</str>
            <str>533</str>
            <str>547</str>
            <str>549</str>
        </arr>
        <str name="hea.resource_type">808</str>
        <arr name="hea.theme">
            <str>778</str>
        </arr>
        <arr name="hea.title">
            <str>Text</str>
        </arr>
        <date name="timestamp">2013-11-07T08:12:22.684Z</date>
    </doc>
</result>
</response>

理想的には、データ キャプチャ レコードとして使用するために、最初の大きな XML を個々の XML ファイルに分割できるようなものを開発したいと考えています。

この背後にある私の最初の考えは、JQuery の $.parseXML を使用して最初の XML を個々のレコードに分離し、それぞれを個別の .XML ファイルとして保存してから、それらを自分の作業 CMS に入れ、DCR に変換できるということです ( CMS)。

私はいくつかのオンライン検索を行いましたが、これを行うにはもっと複雑な方法がたくさんあるようです。理想的には、これを行う方法に関するガイダンスに感謝します.

このようなことを試みたのはこれが初めてであり、これを考慮した締め切りがあります。理想的には、ヒントのヒントや追加の読み物を誰かが提案できれば、それをいただければ幸いです. これは私の最初の研究段階なので、まだ解決策をまとめようとはしていません.

より良いアドバイスを得るために知りたいことを見逃した場合は、お問い合わせください。できるだけ早く回答を投稿するよう努めます.

ご覧いただき、アドバイスをいただきありがとうございます。

**理由についてのコメントなしに、なぜこれがマークダウンされたのか知りたいですか?

ダン

4

2 に答える 2