Sikuli を使用して、ページのソース コードをファイルに保存しました。マトリックス スタイルで配置された要素のバッチの「まとめ」が必要です。しかし、それらの間の寸法を計算したくありません。URL をロケーション バーに入力する必要があります。そこで、MZDN JavaScript の実装を利用して、このような「単純な」操作をゼロから作成しました。lxml を使用したくありません。本当のネイティブ ライブラリが必要です。つまり、「移植可能な」スクリプトが必要です。そこで、しばらくグーグルで調べて、Stack OverFlow で質問することにしました。使いたくない
split('<a href=')
マジック。私はPythonでこれを行いたいです(最もpythonicな方法で):
var array = document.getElementsByClassName('another')
var j = array.length
for (i=0;i<j;i++) {
element = array[i];
url = element.getElementsByTagName('a')[0].href;
console.log(url);
}
var array = document.getElementsByClassName('else')
var j = array.length
for (i=0;i<j;i++) {
element = array[i];
url = element.getElementsByTagName('a')[0].href;
console.log(url);
}
でなんとかできましたsplit
。Pythonは子供向けです。
def read_file(filename):
fd = open(filename, 'r')
data = fd.read()
fd.close()
return data
def href(line):
url = line.split('a href=')[1].split('>')[0].strip().replace('"', '').replace("'", '')
return url
html = read_file('source.htm').split('\n')
for line in html:
if 'one' in line:
print href(line)
elif 'another' in line:
print href(line)
elif 'else' in line:
print href(line)