問題タブ [orange]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
orange - ほとんどの視覚化ツールが Orange.Canvas にありません (2015/06/15 出典)
私のオレンジ色のキャンバスは、Anaconda python2 環境の Mint14 にインストールされています。「視覚化」セクションに表示されるツールは、属性統計、モザイク表示、ふるい線図、およびベン線図です。特に、XY Scatter プロット モジュールは、私が必要とするモジュールです。
ソースは github から取得され、次の命令によってコンパイルされます。
ソースのコンパイル時に、次のエラーが複数回表示されます。
ほとんどのファイルは次の場所にインストールされます。
インストールされた Anaconda パッケージ:
これらの視覚化ツール パッケージのビルドを妨げる重要な要件が不足していますか?
orange - 連続機能を備えたオレンジ ベイズ アルゴリズム
4 つの連続した特徴を持つ 2 クラスのベイズ分類問題があります。オレンジが確率の計算に使用するベイズ アルゴリズム アルゴリズムを部分的に再現しようとしています。しかし、オレンジが出力するのと同じ値を取得することに成功していません。
データセットサイズ: 150 (class0: 88 および class1: 62)
次のアルゴリズムを使用します
ここで、L0 と L1 は尤度です
オレンジは、条件付き確率の計算に LOESS を使用します (それを再現する必要はないと思います)。このデータセットでは、Python オブジェクト classifier.conditional_distributions で指定されているように、両方のクラスに対して 49 ポイントを出力します。Xi の周囲のポイント間の線形補間を使用して、p(Xi|class0) と p(Xi|class1) を計算できます。
1) 連続機能を備えたオレンジ ベイズ アルゴリズムについてコメントできる人はいますか?
2) または、Orange C++ コードをデバッグし、orange/source/orange/bayes.cpp の関数からの中間結果を検査できるコンパイラ/IDE をセットアップする方法に関する技術的なアドバイスはありますか?
orange - Orangeのランダムフォレスト分類器にサンプルの重みを使用するには?
2 つのクラス (良性と悪性) を持つ非常に不均衡なデータセットでランダム フォレスト分類子をトレーニングしようとしています。
以前の質問 ( Orange python パッケージでサンプルの重みを設定して使用する方法は? )のコードを見て、従い、マイノリティ クラスのデータ インスタンスにさまざまなより高い重みを設定しようとしましたが、取得した分類器は正確に機能します同じ。
私のコード:
何か不足していますか?
python - Orange CN2 分類子を使用して、1 つのクラスのみのルールを学習できますか?
不正率が非常に低い (0.1% 未満) 不正検出に Orange CN2 ルール誘導アルゴリズムを使用しています。デフォルトでは、CN2 は両方のクラス (Fraud と Non-Fraud) のルールを学習します。私は Fraud クラス ルールのみに関心があるため、特に多くのデータセットで CN2 を実行する必要があることを考えると、非不正ルールの学習は時間の無駄です。CN2 が Fraud クラス ルールのみを学習することは可能ですか? 可能である場合、スクリプトでこれを構成する方法を教えてください。ありがとう!
python - オレンジ: Orange.classification.rules.RuleClassifier.rules のルールの class_distribution 属性にバグの可能性がありますか?
Orange のドキュメントによると、ルールの class_distribution 属性は「このルールの対象となるデータ インスタンス内のクラスの分布」です。ただし、ルールの導出に使用されたデータセットのデータ インスタンスにルールを適用すると、ルール r を起動するインスタンスの数が r.class_distribution の数と異なる場合があります。
たとえば、Orange パッケージで提供されている adult_sample データセットと次のコードを使用するとします。
82 個のルールのうち 32 個は、上記で定義した rule.class_distribution が ruleFreq と一致していません。
例として RS[5] を使用してみましょう。
これによると、クラス 0 の 3 つのインスタンスがルールを起動しましたが、ruleFreq0[5] = 7 です。つまり、すべてのデータに対してルールを実行すると、クラス 0 の 7 つのインスタンスがルールを起動します。これらの 7 つのインスタンスは、ind0[np.where(rulesFired0[:,5])[0]] によってインデックス付けされます。いくつかの例は次のとおりです。
最後に、ここに私の質問があります:
これは Orange コードのバグですか、それとも class_distribution 属性は、ルールを起動する各クラスから (ルールを学習するために使用されるデータセット全体から) インスタンスの数以外を指定しますか?
この class_distribution は、ルールの品質を計算するために使用されますか? これは、class_distribution の計算でエラーが発生すると、ルールの品質の計算でエラーが発生することを意味します。
sql - オレンジ色のデータマイニング ソフトウェアでの SQL クエリ
select ステートメントと postgres データベースを使用してオレンジ色のデータマイニング ソフトウェアで SQL クエリを実行しようとすると、エラーが返されます。
無効な接続オプション 'PASSWD'
私のクエリは次のようになります。