チュートリアルを進めていて、gensim
わからないことがありました。texts
文字列のネストされたリストです:
In [37]: texts
Out[37]:
[['human', 'machine', 'interface', 'lab', 'abc', 'computer', 'applications'],
['survey', 'user', 'opinion', 'computer', 'system', 'response', 'time'],
['eps', 'user', 'interface', 'management', 'system'],
['system', 'human', 'system', 'engineering', 'testing', 'eps'],
['relation', 'user', 'perceived', 'response', 'time', 'error', 'measurement'],
['generation', 'random', 'binary', 'unordered', 'trees'],
['intersection', 'graph', 'paths', 'trees'],
['graph', 'minors', 'iv', 'widths', 'trees', 'well', 'quasi', 'ordering'],
['graph', 'minors', 'survey']]
そしてsum(texts,[])
与えます:
Out[38]:
['human',
'machine',
'interface',
'lab',
'abc',
'computer',
'applications',
'survey',
'user',
'opinion',
'computer',
リストはさらに数行続きますが、スペースを節約するために残りを省略しました。2 つの質問があります。
1) なぜsum(texts,[])
その結果を生成する (つまり、ネストされたリストを平坦化する) のですか?
2) 出力が奇妙に表示されるのはなぜですか? この出力には何か特別なものがありますか (... または、iPython の動作がおかしいのではないかと思います)。こちらもご覧になりましたらご確認ください。