これはコード スニペットです。
for i in obj:
url = "someurl" + i
oars = requests.get(url, timeout=1)
soup = BeautifulSoup(oars.content)
fout = open(i + ".html", "wt")
print((type(soup.prettify)))
fout.write(oars.text)
oars.close
#fout.write(soup.get_text())
# Still not working, using zsh for now
if call("html2text " + i + ".html" + ">" + i + ".txt", shell=True) == 0:
print("yay")
#call("rm -f " + i + ".html", shell=True)
else:
print(i)
しかし、html2text は、出力を適切にパイプするのではなく、空の txt ファイルを作成しているだけです。に置き換えてみましhtml2text
たelinks -dump
が、役に立ちませんでした。