問題タブ [python-collections]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
660 参照

python - パンダの itertuples は、期待どおりの名前付きタプルではありませんか?

Pandas ドキュメントのこのページを使用して、CSV をデータフレームに読み込み、そのデータフレームを名前付きタプルのリストに変換したいと考えました。

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.itertuples.html?highlight=itertuples

以下のコードを実行しました...

...そして返される型はpandas.core.frame.Synonym、名前付きタプルではありません。これが機能するはずの方法ですか、それとも何か間違っていますか?

私の CSV データは、次の 2 列のデータにすぎません。

例えば。

0 投票する
2 に答える
6869 参照

python - 複数回出現するドキュメント内の単語をカウントする Python Counter() 関数

コレクション ライブラリの Python Counter() 関数を使用した NLP (自然言語処理) プロジェクトに取り組んでいます。次の形式で結果を取得しています。

出力:

問題は、カウントが 1 より大きい単語を抽出したいということです。つまり、カウントが 1 または 2 より大きい単語のみを取得しようとしています。

アウトプットから頻度の低い単語を減らして語彙リストを作りたい。

PS : ほぼ 2000 の異なる単語でデータをテストするために、100 以上のドキュメントがあります。

PPS : 結果を得るためにあらゆることを試みましたが、結果を得ることができませんでした。ロジックのみが必要であり、実装できます。