Pythonからhtml要素のdata-*部分にアクセスすることは可能ですか?私はscrapyを使用していますが、生データはRequestオブジェクトで利用できますが、データ-*はセレクターオブジェクトでは利用できません。
を使用してhtmlをダンプするwget -O page http://page.com
と、ファイル内のデータを確認できます。それは次のようなものです<a href="blah" data-mine="a;slfkjasd;fklajsdfl;ahsdf">blahlink</a>
エディターでその部分を編集できるdata-mine
ので、そこにあることがわかります...行儀の良いパーサーがそれをドロップしているようです。
ご覧のとおり、私は混乱しています。