0

私の使用例では、JavaScript トラッカーは、訪問者がサイトにアクセスするたびに、次の式を使用して一意の ID を生成します。

function generateUUID(){
    return 'xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'.replace(/[xy]/g, function(c) {
        var r = Math.random()*16|0, v = c == 'x' ? r : (r&0x3|0x8);
        return v.toString(16);
    });
}

次のような文字列を生成します (rfc4122):

"3314891e-285e-40a7-ac59-8b232863bead"

次に、Mahout で読み取ることができる Number (Java の BigInteger など) でその文字列をエンコードする必要があります。同様に、(PHP で) 復元して結果を表示します。それを行うための高速で一貫した信頼できる方法はありますか?

いくつかの解決策は次のとおりです。

  • 可能な各文字 (英数字 + '-') を数値 [1..M] にマッピングし、それに応じて各文字位置を合計します。
  • md5 ハッシュから 2 つの long を取得します
  • ハッシュマップをメモリに保持する

どんなアイデアでも大歓迎です!

4

1 に答える 1

1

Mahout が 2 つの long の複合 ID を使用できる場合、以下を使用できます。

UUID uuid = UUID.fromString(string);
long l1 = uuid.getMostSignificantBits();
long l2 = uuid.getLeastSignificantBits();

あなたが本当に長い間立ち往生しているなら、UUID全体に基づいてハッシュの一部を使用するというあなたの考えに同意します

于 2014-01-16T19:23:18.330 に答える