“orange”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

550 参照

orange - ほとんどの視覚化ツールが Orange.Canvas にありません (2015/06/15 出典)

私のオレンジ色のキャンバスは、Anaconda python2 環境の Mint14 にインストールされています。「視覚化」セクションに表示されるツールは、属性統計、モザイク表示、ふるい線図、およびベン線図です。特に、XY Scatter プロットモジュールは、私が必要とするモジュールです。

ソースは github から取得され、次の命令によってコンパイルされます。

ソースのコンパイル時に、次のエラーが複数回表示されます。

ほとんどのファイルは次の場所にインストールされます。

インストールされた Anaconda パッケージ:

これらの視覚化ツールパッケージのビルドを妨げる重要な要件が不足していますか?

orange

2015-06-15T15:12:29.440

0 投票する

1 に答える

74 参照

orange - 連続機能を備えたオレンジベイズアルゴリズム

4 つの連続した特徴を持つ 2 クラスのベイズ分類問題があります。オレンジが確率の計算に使用するベイズアルゴリズムアルゴリズムを部分的に再現しようとしています。しかし、オレンジが出力するのと同じ値を取得することに成功していません。

データセットサイズ: 150 (class0: 88 および class1: 62)

次のアルゴリズムを使用します

ここで、L0 と L1 は尤度です

オレンジは、条件付き確率の計算に LOESS を使用します (それを再現する必要はないと思います)。このデータセットでは、Python オブジェクト classifier.conditional_distributions で指定されているように、両方のクラスに対して 49 ポイントを出力します。Xi の周囲のポイント間の線形補間を使用して、p(Xi|class0) と p(Xi|class1) を計算できます。

1) 連続機能を備えたオレンジベイズアルゴリズムについてコメントできる人はいますか?

2) または、Orange C++ コードをデバッグし、orange/source/orange/bayes.cpp の関数からの中間結果を検査できるコンパイラ/IDE をセットアップする方法に関する技術的なアドバイスはありますか?

orange

2015-06-17T15:11:18.753

0 投票する

1 に答える

529 参照

orange - Orangeのランダムフォレスト分類器にサンプルの重みを使用するには?

2 つのクラス (良性と悪性) を持つ非常に不均衡なデータセットでランダムフォレスト分類子をトレーニングしようとしています。

以前の質問 ( Orange python パッケージでサンプルの重みを設定して使用する方法は? )のコードを見て、従い、マイノリティクラスのデータインスタンスにさまざまなより高い重みを設定しようとしましたが、取得した分類器は正確に機能します同じ。

私のコード:

何か不足していますか？

orange

2015-06-24T13:05:00.330

0 投票する

1 に答える

1254 参照

python - Orange CN2 分類子を使用して、1 つのクラスのみのルールを学習できますか?

不正率が非常に低い (0.1% 未満) 不正検出に Orange CN2 ルール誘導アルゴリズムを使用しています。デフォルトでは、CN2 は両方のクラス (Fraud と Non-Fraud) のルールを学習します。私は Fraud クラスルールのみに関心があるため、特に多くのデータセットで CN2 を実行する必要があることを考えると、非不正ルールの学習は時間の無駄です。CN2 が Fraud クラスルールのみを学習することは可能ですか? 可能である場合、スクリプトでこれを構成する方法を教えてください。ありがとう！

python orange

2015-06-26T20:41:17.187

0 投票する

2 に答える

80 参照

python - オレンジ: Orange.classification.rules.RuleClassifier.rules のルールの class_distribution 属性にバグの可能性がありますか?

Orange のドキュメントによると、ルールの class_distribution 属性は「このルールの対象となるデータインスタンス内のクラスの分布」です。ただし、ルールの導出に使用されたデータセットのデータインスタンスにルールを適用すると、ルール r を起動するインスタンスの数が r.class_distribution の数と異なる場合があります。

たとえば、Orange パッケージで提供されている adult_sample データセットと次のコードを使用するとします。

82 個のルールのうち 32 個は、上記で定義した rule.class_distribution が ruleFreq と一致していません。
例として RS[5] を使用してみましょう。

これによると、クラス 0 の 3 つのインスタンスがルールを起動しましたが、ruleFreq0[5] = 7 です。つまり、すべてのデータに対してルールを実行すると、クラス 0 の 7 つのインスタンスがルールを起動します。これらの 7 つのインスタンスは、ind0[np.where(rulesFired0[:,5])[0]] によってインデックス付けされます。いくつかの例は次のとおりです。

最後に、ここに私の質問があります：

これは Orange コードのバグですか、それとも class_distribution 属性は、ルールを起動する各クラスから (ルールを学習するために使用されるデータセット全体から) インスタンスの数以外を指定しますか?
この class_distribution は、ルールの品質を計算するために使用されますか? これは、class_distribution の計算でエラーが発生すると、ルールの品質の計算でエラーが発生することを意味します。

python orange

2015-07-02T21:18:59.900

0 投票する

1 に答える

631 参照

sql - オレンジ色のデータマイニングソフトウェアでの SQL クエリ

select ステートメントと postgres データベースを使用してオレンジ色のデータマイニングソフトウェアで SQL クエリを実行しようとすると、エラーが返されます。

無効な接続オプション 'PASSWD'

私のクエリは次のようになります。

sql postgresql orange

2015-07-13T20:34:46.227

問題タブ [orange]

orange - ほとんどの視覚化ツールが Orange.Canvas にありません (2015/06/15 出典)

orange - 連続機能を備えたオレンジ ベイズ アルゴリズム

orange - Orangeのランダムフォレスト分類器にサンプルの重みを使用するには?

python - Orange CN2 分類子を使用して、1 つのクラスのみのルールを学習できますか?

python - オレンジ: Orange.classification.rules.RuleClassifier.rules のルールの class_distribution 属性にバグの可能性がありますか?

sql - オレンジ色のデータマイニング ソフトウェアでの SQL クエリ

Reference

orange - 連続機能を備えたオレンジベイズアルゴリズム

sql - オレンジ色のデータマイニングソフトウェアでの SQL クエリ