私はPythonの初心者で、問題があります。リストから最初の 10.000 項目を取得しようとしましたが、間違ったデータが返されました。最初に最初の 10/20/50 アイテムを取得しようとしたため (結果を .txt に出力)、何も得られなかったことに気付きました。コードの一部を次に示します。
/*for key in docs:
T_buffer=docs[key]['tf'].items()
keyset.append(T_buffer)
*/
keyseta = list(itertools.chain(*keyset))
keyseta.sort(key=lambda z: z[1], reverse=True)
keyset=keyseta[:8000]
/*
#t0=time.time() #timer ON
#for infile in docs: #upologismos idf kai tf_idf
# for word in docs[infile]['tf']:
# docs[infile]['idf'][word]= idf(word,voc)
# docs[infile]['tf_idf'][word]= docs[infile]['idf'][word] * docs[infile]['tf'][word]
#print time.time()-t0, "seconds"
*/
loglista1 = open("log1.txt",'w')
print >>loglista1, keyset
リストには次のようなデータが含まれます。
[('uwm', 0.034482758620689655),
('s', 0.034482758620689655),
('the', 0.034482758620689655),
('have', 0.034482758620689655)...]