http://rates.fxcm.com/RatesXMLからデータを取得するために simpleXML を使用しようとして
いますsimplexml_load_file()
が、この Web サイトには常に xml ファイルの前後に奇妙な文字列/数字があるため、時々エラーが発生しました。例:
2000<?xml version="1.0" encoding="UTF-8"?>
<Rates>
<Rate Symbol="EURUSD">
<Bid>1.27595</Bid>
<Ask>1.2762</Ask>
<High>1.27748</High>
<Low>1.27385</Low>
<Direction>-1</Direction>
<Last>23:29:11</Last>
</Rate>
</Rates>
0
次に、 file_get_contents を使用して で文字列として解析することにしました。その後、前後の文字列を削除するためsimplexml_load_string()
に使用します。substr()
ただし、ランダムな文字列が次のようにノード間に表示されることがあります。
<Rate Symbol="EURTRY">
<Bid>2.29443</Bid>
<Ask>2.29562</Ask>
<High>2.29841</High>
<Low>2.28999</Low>
137b
<Direction>1</Direction>
<Last>23:29:11</Last>
</Rate>
私の質問は、どこに配置されているかに関係なく、正規表現関数を使用して、これらすべてのランダム文字列を一度に処理できる方法はありますか? (サイトに連絡して適切なxmlファイルをブロードキャストしてもらうよりも、その方が良い考えだと思います)