-1

これがばかげた質問である場合はお詫びします。私は Python を初めて使用し、Excel VBA に精通しています。

Excel ドキュメントに格納されている複数の記事の URL を Python でループさせ、さまざまな URL の要約を作成しようとしています。目標は、記事のタイトル、要約、および URL を新しい Excel (または別のタブ) にエクスポートすることです。(最終的な目標は、関連するニュースをかき集めて要約することですが、私はそれに向けて取り組んでいます!)

ただし、作成したリストから渡された URL を新聞記事関数で読み取るのに問題があります。URL を印刷すると、単にコピーして貼り付けて url = 'the copy pasted value' を設定した場合とまったく同じように見えます。ただし、その URL で「Article」関数を実行すると、URL が正しく読み取られないようです。それらは文字列としてリストに格納されます。何が間違っているのかわからない。どんな助けでも大歓迎です!!

# Import the libraries
import nltk
from newspaper import Article
import openpyxl

# import the URLs from the Excel
from openpyxl import load_workbook
wb = load_workbook(r'C:\Users\Python\RunPythonScript.xlsm')  # Work Book
ws = wb.get_sheet_by_name('URLs')  # Work Sheet
column = ws['A']  # Column
column_list = [column[x].value for x in range(len(column))] # create a list
url_list = list(filter(None, column_list)) # remove blanks
url_list.pop(0) # remove title

# start loop
x = 0
while x < len(url_list):


   url = str("'" + url_list[x] + "'") # set url  
   article = Article(url) # Get the article ### seems to be where error is ###
   print(article)

   x = x + 1 # move to next url

Python から次の出力が得られます。

<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>
<newspaper.article.Article object at 0x07DADB38>
<newspaper.article.Article object at 0x0A698670>

記事を印刷する代わりに、URL でエラーが発生しているようです。

洞察はありますか?前もって感謝します!!

4

2 に答える 2