私は現在、数十万の文字列 (それぞれ最大 4000 文字) を処理し、これらの文字列に適用された関数の結果に基づいて簡単な操作を実行するアルゴリズムを開発しています。現在、Java と Mysql データベースを 1 つのテーブルで使用しています。
ID | String | attribute a | attribute b | ....
| | | | ....
基本的に、アルゴリズムはまず 1 つの ID を取得し、格納されている文字列を読み取り、その文字列に対して機能を実行します (現在アクティブな列の属性が設定され、読み取られます)。たとえば、ある関数は文字列から ID を抽出し (単純な文字列解析)、この ID を「属性 a」列に格納します。エントリが解析されると、アルゴリズムは「属性 a」を読み取り、この ID を持つ行にジャンプし、プロセスが最初からやり直されます。
多分私はこれを少し考えすぎています。しかし、現在の設定にはオーバーヘッドが非常に大きいため、簡単な変更を行ったり、クエリをすばやくテストしたりすることはほとんど不可能です。このような大規模なデータセットを直接操作するために設計され、文字列操作のための効率的な機能を提供する、より優れたツールまたはプログラミング言語はありますか?
仕事に適したツールを使用することで時間を節約し、長期的にフラストレーションを防ぐことができると信じているため、まったく新しい言語の学習に時間を費やすことは絶対に気にしません.