0

データ サーバーから多数 (数千) のデータ ファイルをダウンロードできるスクリプトを作成しようとしています (例: http://hydro1.sci.gsfc.nasa.gov/thredds/catalog/GLDAS_NOAH10SUBP_3H/2011/345 )。 / )。残念ながら、各ディレクトリ内のファイルの名前は、同じようにフォーマットされていません (作成された時刻がファイル名の末尾に追加されます)。ファイル名を指定してデータをサブセット化し (これらのデータ型用の特別なツールを持っています)、ダウンロードできるようにする必要があります。ファイル名を抽出する関数が matlab に見つかりません。

URLREAD を見てきましたが、html コードを含むすべてをダウンロードします。

ご協力いただきありがとうございます!

4

1 に答える 1

0

リンクを簡単に解析できます。

x=urlread(url)
links=regexp(x,'<a href=''([^>]+)''>','tokens')

すべてのリンクを読み取ります。不要なリンクをすべてフィルタリングする必要があります。

たとえば、これはすべての grb ファイルを取得します。

a=regexp(x,'<a href=''([^>]+.grb)''>','tokens')
于 2013-11-08T20:52:13.297 に答える