私は意見を求めているのではなく、ドキュメンテーションについてもっと求めています。
多くのデータ ファイル (XML、CSV、Plantext など) があり、それらを処理してデータ マイニングする必要があります。
主任データベース担当者は、ストアド プロシージャを使用してタスクを達成することを提案しました。基本的に、ファイルがシリアル化され、CLOB または XML 列に保存されるステージング テーブルがあります。そこから、さらにストアド プロシージャを使用してファイルを処理することを提案しました。
私はデータベースのバックグラウンドを持つアプリケーション開発者であり、アプリケーション開発についてもそうです。偏見があるかもしれませんが、DBでこのロジックを使用することは悪い考えのようであり、私が言及していることを証明または不承認にするためのドキュメントを見つけることができません電車の線路に車を乗せて荷物を引っ張るように。
私の質問は次のとおりです。正規表現検索、CLOB 内のデータの検索と置換、DOM トラバーサル、再帰について話しているとき、DB (Oracle、DB2、MySQL、SqlServer) はどのくらいうまく機能しますか? 同じ問題について、Java、PHP、C# などのプログラミング言語と比較してください。
編集
だから私が探しているのは、特に文字列の検索と置換、正規表現の検索と置換について、DBMS と比較した特定のプログラミング言語の比較/ランタイム分析に関するドキュメントです。XML Dom トラバーサル。再帰的なメソッド呼び出しでのメモリ使用量。特に、10 ~ 100 GB のデータに遭遇したときのスケーリングの良さです。