ファイルシステムに保存したい 1 億を超える文字列があります。文字列 (~255Chars utf8) とともに、2 つの日付とそのプロパティを定義するいくつかの整数値があります。
それらを CSV ファイルに入れることもできますが、それは巨大になります。いくつかの小さな CSV ファイルをサブディレクトリに配置して処理を高速化するか、単純に文字列ごとにファイルを作成してディレクトリ ツリーに保存することができます。
どのソリューションがより速く、より保守/開発しやすいかを知るにはどうすればよいですか? 自分の文字列がどれほどまばらであるかさえわかりません。おそらく、同じ文字で始まる 5,000 万個あるため、ツリーのバランスが取れていません。
今のところ、最初の 5 文字でディレクトリ構造を作成し、各ディレクトリに csv ファイルを配置することを考えています。例えば。文字列「I don't know what I'm doing」 -> 「Idontknowwhatimdoing」が入ります
/i/d/o/n/t/list.csv
もっと良いアイデアはありますか?私は Db を使用できません。Java を使用してファイルシステムを保存し、php を使用してファイルシステムを読み取ります。