手元に問題文があり、それが機械学習で解決できるかどうかを知る必要があります。こんなふうになります :-
ユーザーがドキュメントをアップロードできるシステムがあるので、xxxZxxx.xxx という名前のファイルがあるとします。
ユーザーはシステムのフォルダー構造に複数のレベルを移動し、ファイルを配置します (たとえば、A/B/C/D/Z/xxxZxxx.xxx)。
ファイル名を読み取り、 それが配置されるパスを提案するシステムを作成する必要があります。
この場合、ファイル名にはパスの最後の部分が含まれています。これはビジネス オブジェクト ディレクトリですが、含まれていない場合があります。このようなパスとドキュメントは 10^5 の順序で存在します。
また、新しいパス、つまりビジネス オブジェクトが時間とともに追加される可能性があるため、これは、増加し続ける約 10^5 クラスのマルチクラス分類になります。
これは解決可能ですか?
失敗した特徴ベクトルとして、文字の袋 (言葉の袋から着想を得た) を使用しようとしました。
これに従うことができるアプローチに関するコメントはありますか? 他の情報が必要な場合はお知らせください。質問を編集するか、タグを変更します。