キーフィールドとして言語コードを持つオブジェクトがたくさんあります。JavaとMongodbはどちらもUTF-8をネイティブに使用し、言語コードはASCIIであるため、文字ごとに1バイトと\0ターミネータを使用する必要があるようです。したがって、言語コード「en」は、BSONオブジェクトとインデックスで3バイトしか使用しない必要があります。
これは正しいです?フィールドを次のようなバイト配列に変換して何かを保存するかどうか疑問に思っています。
byte[] lcBytes = langCode.getBytes("ISO-8859-1");
JavaドライバーでMongodbに保存する前に?