6

いくつかのデータ マイニング タスクに Orange (Python) を使用しています。より具体的には、クラスタリング用です。チュートリアルを完了し、ほとんどのドキュメントを読みましたが、まだ問題があります。ドキュメントとチュートリアルのすべての例は、データを含むタブ区切りのテーブルがあることを前提としています。ただし、新しいテーブルを最初から作成する方法については何も述べられていません。たとえば、さまざまなドキュメントでの単語の頻度の表を作成したいと考えています。

たぶん私は何かを見逃しているので、誰かが洞察を持っていれば幸いです。

ありがとうジョージ

編集:

これが私のテーブルの作成方法です

#First construct the domain object (top row)
vars = []
for var in variables:
    vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class    
#Add data rows assuming we have a matrix 
t = Orange.data.Table(domain, matrix)        
4

2 に答える 2

5

これを理解するのに何時間もかかりました。Python では、次のようにします。

Import Orange
List, Of, Column, Variables = [Orange.feature.Discrete(x) for x in ['What','Theyre','Called','AsStrings']]
Domain = Orange.data.Domain([List, Of, Column, Variables])
Table = Orange.data.Table(Domain)
Table.save('NewTable.tab')

コードの各ビットが何をするのかを説明したいと思いますが、今のところよくわかりません。これほど強力なツールキットに、これほど理解しにくいドキュメントが用意されているのはおかしいですが、それはユーザー ベース全体が博士号を持っているためだと思います。

于 2012-07-04T22:06:11.503 に答える
2

あなたが私に尋ねると、ドキュメントは確かに不十分です。これは質問に対する答えではないかもしれませんが、他の誰かに役立つかもしれません. アソシエーション ルール マイニング タスクのためだけに、コンストラクターとドメインを使用してテーブルを作成しようと何時間も試みましたが、最終的にテーブルを作成する最も簡単な方法は、拡張子 .tab のファイルにデータを書き込むことであることがわかりました。または .basket からテーブルを作成します。

Orange.data.Table("yourFile.basket")

もちろん、ファイルの構造は正しい必要があります。datasets/内の Orange パッケージ ディレクトリにあるサンプル ファイルを参照してください。

于 2014-10-29T15:23:46.593 に答える