Python で文字列のリストをランダム化する最良の方法として、この回答を潜在的に読んだことがあります。次のコードを介して約3000万の要素のリストがあるため、それが最も効率的な方法であるかどうか疑問に思っています:
import json
from sets import Set
from random import shuffle
a = []
for i in range(0,193):
json_data = open("C:/Twitter/user/user_" + str(i) + ".json")
data = json.load(json_data)
for j in range(0,len(data)):
a.append(data[j]['su'])
new = list(Set(a))
print "Cleaned length is: " + str(len(new))
## Take Cleaned List and Randomize it for Analysis
shuffle(new)
より効率的な方法があれば、その方法についてアドバイスをいただければ幸いです。
ありがとう、