これがばかげた質問である場合はお詫びします。私は Python を初めて使用し、Excel VBA に精通しています。
Excel ドキュメントに格納されている複数の記事の URL を Python でループさせ、さまざまな URL の要約を作成しようとしています。目標は、記事のタイトル、要約、および URL を新しい Excel (または別のタブ) にエクスポートすることです。(最終的な目標は、関連するニュースをかき集めて要約することですが、私はそれに向けて取り組んでいます!)
ただし、作成したリストから渡された URL を新聞記事関数で読み取るのに問題があります。URL を印刷すると、単にコピーして貼り付けて url = 'the copy pasted value' を設定した場合とまったく同じように見えます。ただし、その URL で「Article」関数を実行すると、URL が正しく読み取られないようです。それらは文字列としてリストに格納されます。何が間違っているのかわからない。どんな助けでも大歓迎です!!
# Import the libraries
import nltk
from newspaper import Article
import openpyxl
# import the URLs from the Excel
from openpyxl import load_workbook
wb = load_workbook(r'C:\Users\Python\RunPythonScript.xlsm') # Work Book
ws = wb.get_sheet_by_name('URLs') # Work Sheet
column = ws['A'] # Column
column_list = [column[x].value for x in range(len(column))] # create a list
url_list = list(filter(None, column_list)) # remove blanks
url_list.pop(0) # remove title
# start loop
x = 0
while x < len(url_list):
url = str("'" + url_list[x] + "'") # set url
article = Article(url) # Get the article ### seems to be where error is ###
print(article)
x = x + 1 # move to next url
Python から次の出力が得られます。
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
記事を印刷する代わりに、URL でエラーが発生しているようです。
洞察はありますか?前もって感謝します!!