私の使用例では、JavaScript トラッカーは、訪問者がサイトにアクセスするたびに、次の式を使用して一意の ID を生成します。
function generateUUID(){
return 'xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'.replace(/[xy]/g, function(c) {
var r = Math.random()*16|0, v = c == 'x' ? r : (r&0x3|0x8);
return v.toString(16);
});
}
次のような文字列を生成します (rfc4122):
"3314891e-285e-40a7-ac59-8b232863bead"
次に、Mahout で読み取ることができる Number (Java の BigInteger など) でその文字列をエンコードする必要があります。同様に、(PHP で) 復元して結果を表示します。それを行うための高速で一貫した信頼できる方法はありますか?
いくつかの解決策は次のとおりです。
- 可能な各文字 (英数字 + '-') を数値 [1..M] にマッピングし、それに応じて各文字位置を合計します。
- md5 ハッシュから 2 つの long を取得します
- ハッシュマップをメモリに保持する
どんなアイデアでも大歓迎です!