問題タブ [outliers]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1481 参照

r - 外れ値に名前が付いた複数の箱ひげ図

私はこのような箱ひげ図を持っています:

ここに画像の説明を入力してください

最初の列を次のように設定したため、外れ値の名前が表示されます。

ここで、新しい複数の箱ひげ図を作成する方法を知りたいと思います。同じ画像に2つの箱ひげ図を作成したいと思います。データはまだスライドデータベースにあります。2つの列の名前は次のとおりです。

  1. ski_parc(slide $ ski_parc)
  2. snow_parc(slide $ snow_parc)

2つの箱ひげ図を同じ画像に表示する方法がわかりません:

  • 2つの箱ひげ図のそれぞれの印刷画面に表示されるような外れ値の名前
  • それらを認識するための各箱ひげ図の下の箱ひげ図の名前

編集:ここに私のデータベーススライドのリンクがあります

0 投票する
8 に答える
541 参照

algorithm - 群れから離れた動物をすばやく見つけるアルゴリズム

シミュレーションプログラムを開発しています。動物 (ヌー) の群れがあり、その群れの中で、群れから離れている 1 匹の動物を見つけることができる必要があります。

下の写真では、緑の点が群れから離れています。早く見つけたいのはこういうところです。

緑の点は群れから離れています

もちろん、その問題を解決するための簡単なアルゴリズムがあります。各ポイントの近傍にあるドットの数を数え、その近傍が空 (0 ポイント) の場合、このポイントが群れから離れていることがわかります。

問題は、このアルゴリズムがまったく効率的でないことです。私は 100 万点を持っていますが、このアルゴリズムを 100 万点のそれぞれに適用すると非常に時間がかかります。

もっと速くなるものはありますか?多分木を使う?

@amit の編集: そのようなケースは避けたいと思います。左隅にある緑色の点のグループが選択されますが、群れから離れているのは 1 匹の動物ではなく、動物のグループであるため、選択すべきではありません。群れから離れた 1 匹の動物のみを探しています (グループではありません)。

群れから離れた緑色の点のグループ

0 投票する
2 に答える
917 参照

r - 外れ値をインデックス化する方法は?

以下のデータがあります。出版数が最も多い著者を特定するにはどうすればよいですか?

私はこれを試します

しかし、うまくいかないようです。

0 投票する
2 に答える
30652 参照

machine-learning - 不正検出用のデータセットが必要

不正検出アルゴリズムがあり、それが実際のデータセットに対して機能するかどうかを確認したいと思います。

私のアルゴリズムは、クレームは通常であるかどうかを示しています。

利用可能なデータセットはありますか?

0 投票する
1 に答える
143069 参照

r - Rの箱ひげ図の外れ値を削除するにはどうすればよいですか?

重複の可能性:
箱ひげ図の外れ値ルールを変更する

箱ひげ図を使用して結果を視覚化する必要があります。

視覚化中に外れ値をフィルタリングするにはどうすればよいですか?

(1)醜い外れ値がなくても、画面全体に画像を表示できるようにします。

http://postimage.org/image/szzbez0h1/a610666d/

(2)特定の範囲までの外れ値を表示する方法はありますか? http://postimage.org/image/np28oee0b/8251d102/

よろしく

0 投票する
2 に答える
4614 参照

r - データフレームからの単変量外れ値の削除(+ -3 SD)

私はRに慣れていないので、他の人の質問で必要なものを見つけるのに苦労しています。私の質問はとても簡単なので、他の誰もわざわざ質問することはないと思います。

特定の変数で、条件内で単変量の外れ値(条件の平均から3 SDである点として定義している)であるデータを除外する新しいデータフレームを作成するための最も簡単なコードは何でしょうか?

私が試したことを示すのは恥ずかしいですが、ここにあります

そして、私はすでにそこに立ち往生しています。

ありがとう

0 投票する
2 に答える
2014 参照

excel - Plot data points beyond the axis maximum as the maximum

I have a set of graphs that I generate automatically, that I need to adjust slightly. My Y Axis goes from 0 - 1000 but I have some values outside of this range. For those values that occur beyond 1000 I would like to plot a point at 1000 to alert the user to the fact that the data exists.

A desired features: if it would be at all possible to change the format of an individual data point based on a cell value (ie a cell value greater than 1000) that would be fantastic; this isn't necessary but it would make reviewing the data (nearly 100 charts) even easier.

thanks!

0 投票する
3 に答える
2524 参照

r - 外れ値を決定するために Outline=FALSE が使用する方法は何ですか?

R では、outlier=FALSE パラメーターを使用して、特定のセットのボックスとウィスカーをプロットするときに外れ値を除外しました。それは見事に機能しましたが、どの要素が外れ値であるかをどのように正確に判断するのか疑問に思っています.

0 投票する
1 に答える
100 参照

r - getOutliersIの制限のデフォルトの方法は何ですか?

extremevaluesRのパッケージを使用して単変量の外れ値を検出します。確かに統計についての理解は限られていますが、getOutliersI関数の一部が外れ値を判別するために何をしているのかを概念的に把握しようとしています。パッケージのドキュメントを調べてみましたが、見つかりません。

データに対して関数を呼び出すと、常識に合った結果が得られます。

rhoまたはFLim引数を提供していないので、制限を計算していますが、どのようにしたらよいでしょうか。

0 投票する
2 に答える
1664 参照

matlab - Matlab は、発生したデータと時間から外れ値を計算します

Matlab には大きな行列 A があります。行列の最初の列には秒単位の時間が含まれています。2 番目から 13 番目の列には、計算の結果が含まれます。各列 (最初の列を除く) について、次の方法でひげを計算しました。

変位値(A,[.75])-1.5*(変位値(A,[.75])-変位値(A,[.25]))

ここで、各列に外れ値 (= ひげの下の値) がいくつあり、いつ発生するかを知りたいと思います。これにより、外れ値が時間の経過とともにどれだけ広がっているかを計算できるようになります。

私は、2 つの列を含む 12 の martices を提供するループを作成することを好みます。2 番目の列には、外れ値の値 (= ひげの下のセルの値) を間にゼロを入れずに含める必要があります。最初の列には、外れ値が発生した時間を (時系列で) 含める必要があります。

どうすればこれを作成できますか?

よろしく、

ヴィンセント