python - Python で NLP 用にすべてのインデックスを解析する方法

翻译自：https://stackoverflow.com/questions/67529427 2021-05-14T05:25:53.573

39 次

nlpot を使用して単語を視覚化するために、DataFrame のすべてのインデックスを解析したいと考えています。

これで、データフレームの 1 つの文を正常に実行できました。

import pandas as pd
path = r'C:\Users\LIVE Screening.csv'
df = pd.read_csv(path, sep=',', encoding='cp932')
df.head()
***
VOICE
0   字が綺麗になりたいから
1   始めたきっかけは親の影響です。
2   字がきれいになりたいから
3   字が綺麗な友人に憧れて。
4   文字を綺麗に書きたいと思ったので習い始めました。

df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 1 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   VOICE   20 non-null     object
dtypes: object(1)
memory usage: 288.0+ bytes
import MeCab
ps = tagger.parse(df['VOICE'][0])
line2 = ps.split('\n')
words = []
import re
for line in line2:
    items = re.split('[\t,]',line)
    if len(items) >= 2 and items[1] == '助詞':
        continue
    words.append(items[0])

print(' '.join(words))
***
字 が 綺麗 に なり たい から EOS

データフレームのすべてのインデックスを解析するためにいくつかの方法で「for」を試しましたが、どれも成功しませんでした。アドバイスをいただければ幸いです。

python - Python で NLP 用にすべてのインデックスを解析する方法

0 に答える 0

Related

Reference