0

関数 extractFeatures fromNMF packageは、特徴が次の両方の基準を満たしている場合にのみ、次の方法を使用して特徴を選択できます。

\hat{\mu} + 3 \hat{\sigma}ここで、\hat{\mu}とはそれぞれスコア\hat{\sigma}の中央値と中央絶対偏差 (MAD) です。

基底成分への最大寄与は、すべての寄与 (つまり、W のすべての要素) の中央値よりも大きくなります。

最初の基準のみをデータマトリックスに適用するこの関数をRでどのように書くことができますか?

キム H とパク H (2007)。「マイクロ アレイ データ解析のための負でない制約付き最小二乗法を交互に使用する疎な非負行列因数分解」。Bioinformatics (Oxford, England)23 (12)、pp. 1495-502。ISSN 1460-2059、、。

4

1 に答える 1

1

vectorscoresを指定すると、各スコアの条件は次のように確認できます。

scores <- rnorm(5)
scores > (median(scores) + 3 * mad(scores))
# [1] FALSE FALSE FALSE FALSE FALSE

madパッケージstatsがまさにそれを行うため、MADの関数を探す必要はありません。いくつかのマトリックスから対応する列を選択したい場合Mは、簡単に書くことができます

M[, scores > (median(scores) + 3 * mad(scores))]

そのための関数を好む場合は、次を使用できます

featureCriterion <- function(M, scores)
  M[, scores > (median(scores) + 3 * mad(scores))]
于 2018-03-05T17:17:58.203 に答える