Gensim の Doc2Vec では、文のベクトルをどのように組み合わせて段落の単一のベクトルを作成しますか? 段落全体でトレーニングできることはわかっていますが、文脈などのために、個々の文でトレーニングする方が明らかに良いでしょう. (私は思う...?)
アドバイスや通常の使用例はありますか?
また、モデルから文/段落ベクトルを取得するにはどうすればよいですか?
Doc2Vec のアーキテクチャ自体には解析が含まれておらず、段落全体でトレーニング/テストすることは理にかなっています。
元の論文では、著者は、段落全体を 1 つの文として扱うだけで、既存の手法を上回る結果を示しています。