-3

何千もの大きなテキストを (相互に) 比較するスクリプトを作成する必要がありました。そして、MySQL がこれに最適なソリューションであるかどうか疑問に思っています。シンプルだがプロセッサ時間のかかるコンピューティングを行うために使用できる無料のデータベースシステムは他にありますか?

私をあなたの知識のプールに放り込んでください!

編集: ドキュメントの性質 - 500-7000 文字のドキュメント、-> テキストが他のドキュメント (盗作) と統計に一致する場合にドキュメントを比較する -> そのような素敵な設定で見つかった文の % 一致他の文字列は、まだ一致していると見なされるために異なる場合があります..

テクノロジはサーバー ベースであるべきです。私は DB にもっと興味があるので、それをスクリプト化するための適切な言語を選択します。

詳細仕様: DB のサイズは無制限にする必要があります。

4

6 に答える 6

2

Lucene の使用を検討する必要があります。大量のテキストを保存し、非常に高速にクエリを実行できます。関連性マッチングも良好です。

于 2008-10-14T21:12:18.583 に答える
1

使用するテクノロジーについては言及していません。テキスト エントリのサイズまたは比較の性質。しかし、私はh2 データベースが優れていることを発見しました。これはネイティブ Java であり、セットアップが簡単なメモリ内データベースとして使用できます。

于 2008-10-14T20:50:45.867 に答える
1

PostgreSql は無料のデータベース エンジンで、MySQL の他にスケーラブルで広く使用されています。

于 2008-10-14T20:52:31.213 に答える
0

MySQLをお勧めします。たくさんの文字列処理機能が組み込まれています。

于 2008-10-14T21:10:28.650 に答える
0

SQL Server Express

于 2008-10-14T20:45:10.900 に答える
0

指定しないので、SQL Server 2008 Express Editionではないのはなぜですか?

4Gb のデータベースを超えることができないという唯一の問題がある兄貴分 SQL Server 2008 のすべての検索機能。

于 2008-10-14T21:19:49.117 に答える