問題タブ [countvectorizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - ユーザー定義関数の実行に失敗しました ($anonfun$createTransformFunc$1: (文字列) => 配列
以下に示すように、DataFrameを生成しました
結果:
その結果、以下のように CountVectorizer を使用しようとしています:
ただし、次のものが生成されます。
このエラーの原因がわかりません。データフレームで「(」を疑っていますが、おそらく私も間違っている可能性があります。いずれにせよ、それとこれを削除するにはどうすればよいですか?
python - txt ファイルを 1 つの文字列に読み込んでロジックを文書化するための変換関数
フォルダーに多数の .txt ファイルがあります。これらのファイルを読み取り、1 つの文字列として変数に保存するために使用する 2 つの関数を次に示します。
CountVectorizer()
今、テキストからn-gramを取得するためにsklearnを使用するという私の考え。ただしCountVectorizer()
、文字列を入力として受け取りません。だから私の質問は、ファイルを1つの文字列に保存するのではなく、そのロジックを使用して保存するようにファイルを読み取る関数を作成するにはどうすればよいですか? TXT']
前もって感謝します!