いくつかのデータ マイニング タスクに Orange (Python) を使用しています。より具体的には、クラスタリング用です。チュートリアルを完了し、ほとんどのドキュメントを読みましたが、まだ問題があります。ドキュメントとチュートリアルのすべての例は、データを含むタブ区切りのテーブルがあることを前提としています。ただし、新しいテーブルを最初から作成する方法については何も述べられていません。たとえば、さまざまなドキュメントでの単語の頻度の表を作成したいと考えています。
たぶん私は何かを見逃しているので、誰かが洞察を持っていれば幸いです。
ありがとうジョージ
編集:
これが私のテーブルの作成方法です
#First construct the domain object (top row)
vars = []
for var in variables:
vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class
#Add data rows assuming we have a matrix
t = Orange.data.Table(domain, matrix)