0

私はいくつかの HTML をスクレイピングし、データを xml ドキュメント (基本的には <li><a>something</a></li> タグの束) に配置しています。これらのいくつかには <li><a>This のようなテキストがあります(もの)です</a></li>

そのため、私のスクレーパーは <This_is_(stuff)> を作成していましたが、ブラウザーで xml を取得したときに拒否されていました。( の代わりに何を使用できますか?

ありがとう

4

1 に答える 1

0

当たり前。かっこの内容を取得して、属性に配置しました。XML をいじってからしばらく経ちました。

于 2012-11-28T20:47:24.743 に答える