0

10,000 行を含む Excel ファイルがあり、各行にはツイートの情報が含まれています。たとえば、これらの列: ツイート、ツイートの日付、ユーザー名、リツイート数、...、ユーザーの場所センチメント(この列の値はポジティブまたはネガティブまたはニュートラルです)、状態(この列の値は 50 州です) the USA), Abbreviation (この列の値は、CA、NJ、NY、..などの州の略語です), CountofNegative (この列は空です。この列には各州のネガティブなツイートの数を書きたいと思います)であるため、この列には 50 個の数値が含まれます)。

以下に、このデータセットのスクリーンショットを示します。 ここに画像の説明を入力

問題: 各州またはその略語に対する否定的なツイートの数をカウントし、CountofNegative 列に書き込みます。以下は私のコードです:

import pandas as pd

file=pd.read_excel("C:/Users/amtol/Desktop/Project/filter.xlsx")
UserLocation= file["User Location"]
Sentiment= file["Sentiment"]
CountofNegative= file["CountofNegative"]
State=file["State"]
Abbreviation= file["Abbreviation"]

for i, (loc,sent) in enumerate(zip(UserLocation, Sentiment)):
    count=0
    for j, (state, abbr) in enumerate(zip(State, Abbreviation)):
        if (loc == state or loc == abbr and sent == "Negative"):
            count=count+1
        file.loc[j+1,"CountofNegative"]=count

print(CountofNegative)

file.to_excel("C:/Users/amtol/Desktop/Project/filter.xlsx")

エラーはありませんが、出力ファイルが作成されると、列 "CountofNegative" の最初の 24 個の値はゼロで、残りは 1 です (これらは正解ではありません)。また、プログラムを でテストしたかったのですがprint(CountofNegative)、それでも何も起こりませんでした。(出力なし)。コードを修正するにはどうすればよいですか?

4

1 に答える 1