リレーショナルDBに格納されている情報に複雑なアルゴリズムを実装するためのベストプラクティスを見つけようとしています。
具体的には、多くのドキュメントのTFxIDFベクトルを含む大規模なMS SQL Serverデータベースにk-meansアルゴリズム(ドキュメントクラスタリングアルゴリズム)のバリエーションを実装したいと考えています(これらのベクトルはアルゴリズムの入力として使用されます)。
私の最初の考えは、ストアドプロシージャ、関数、ビュー、およびその他すべての基本的なSQL Serverツールを使用してSQLですべてを実行することでしたが、その後、 SQLサーバー。
ここではパフォーマンスが問題になるので、それも考慮する必要があります。
私がとるべき道についてのアドバイスをいただければ幸いです。
ありがとうございました!