0

Python を使用したテキスト処理は初めてです。次のコードでは、TfidfTransformer を使用して、特定のドキュメント (1 つのドキュメントのみ) の正規化された行列を計算します。私の質問は、背景やコーパスが指定されていない場合、idf 値はどのように計算されるのですか? idf を計算するには、ドキュメントのコレクションが必要であることを理解しています。

sentences = sentence_tokenizer.tokenize(input)
temporary = CountVectorizer().fit_transform(sentences)
normalized_matrix = TfidfTransformer().fit_transform(temporary)
4

0 に答える 0