YQL(Appcelerator Titaniumモバイルアプリ用)でいくつかのWebサイトをスクレイプしようとしています。
必要なデータはAタグ内にありますが、次の形式になっています。
<a href="...">
<strong>Drugs</strong> and Culture</font>
</a>
したがって、次のようなクエリを実行すると、次のようになります。
select * from html where url='...' and xpath="//table[2]/tr/td[2]//a"
私は得る:
{"strong": "Drugs", "content": "\n and Culture"}
これらの「強力な」タグを無視してテキスト値で応答するには、YQLが必要です。
{content: "Drugs and Culture"}
あなたはそれを行う方法を知っていますか?