問題タブ [dendrogram]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - カット デンドログラムのターミナル ノードにラベルを付けるにはどうすればよいですか?
次のコードを使用して、デンドログラムを特定の高さでカットしました。問題は、デンドログラムをカットするときに、ノードにラベルを追加する方法がわからないことです。ラベル付きのデンドログラムをカットするにはどうすればよいですかRプログラムを使用していますか?
r - 大規模なデータセットでデンドログラムをプロットする方法は?
樹状図描画機能を持つ R の ape (Analysis of Phylogenetics and Evolution) パッケージを使用しています。次のコマンドを使用してデータを Newick 形式で読み取り、プロット関数を使用して樹形図を描画します。
データ セットが非常に大きいため、ツリーの下位レベルで詳細を確認することはできません。黒い領域しか見えませんが、詳細はわかりません。上からは数レベルしか見えず、詳細はわかりません。
プロット機能のズーム機能があるかどうか疑問に思っていました。xLim と yLim を使用して領域を制限しようとしましたが、それらは領域を制限するだけで、詳細を表示するためにズームしません。ズームするか、ズームせずに詳細を表示すると、問題が解決します。
また、問題を解決するのに役立つ他のパッケージ、関数、またはツールを知っていることもありがたいです。
ありがとう。
r - Rでツリーを樹状図に変換する方法は?
ツリー(Javaプログラムの出力)をRの樹状図に変換するにはどうすればよいですか?
現在、ここに示す提案を使用して、ツリーをNewick形式に変換しています。次にape
、Rのパッケージを使用して、Newick形式のツリーを読み取ります。
最後にas.hclust
、Rでツリーを樹状図に変換するために使用します。
ただし、樹状図には枝の長さが必要です。ブランチの長さを挿入しましたが、ツリーが超距離ではないというエラーが表示されます。
as.hclust.phylo(gcPhylo)のエラー:ツリーは超距離ではありません
ブランチの長さを挿入しているときに、何か問題が発生していると思います。
私が従うことができる他の方法はありますか?または、ツリーをNewick形式に変換するときに、ブランチの長さを挿入するにはどうすればよいですか?ブランチの長さを等しくしても問題ありません。
matlab - Matlab での凝集クラスタリング
凝集的にクラスタリングしたい単純な 2 次元データセットがあります (使用する最適なクラスタ数がわからない)。データを正常にクラスター化できた唯一の方法は、関数に「maxclust」値を与えることです。
簡単にするために、これが私のデータセットだとしましょう:
当然、このデータは 2 つのクラスターを形成する必要があります。これを知っていれば、次のように言えます。
そして、どのポイントが各クラスターに分類されるかを見つけるには、次のように言えます。
と
しかし、このデータセットには 2 つのクラスターが最適であることを知らずに、これらのデータをクラスター化するにはどうすればよいでしょうか?
ありがとう
r - 複数の色で ggdendro の葉にラベルを付ける
クラスラベルが付いたデータポイントで樹形図をプロットしている状況があります。凝集クラスタリングが同じラベルを持つものをグループ化することを望みます。ラベルを色分けすると、このような樹状図が読みやすくなります。R の ggdendro でこれを達成する方法はありますか?
matlab - デンドログラム関数の戻りベクトルについて
次のようなmatlab関数を使用して樹状図を描いています
MATLAB ドキュメントによると、返される h1 は樹状図の線へのハンドルのベクトルです。私はそれが意味することを知りません。私の場合、リターン h1 は
h1 =
174.0048
175.0043
このベクトルをどのように使用しますか?
r - 生成されたデンドログラムからクラスター情報を抽出する
生成されたデンドログラム グラフでは、列は距離のカットオフを示します。これらの距離カットオフごとにクラスター情報を取得する方法はありますか。具体的には、Matlab または R でそれを行う方法は?
r - Rで高解像度の樹状図プロットを生成する
Rで高解像度の樹状図を生成しようとしています。
難しいのは、200を超えるリーフノードがあり、各ノードが文字列で識別されることです。これらの文字列ラベルのそれぞれが、生成された(印刷された)プロットで読み取り可能であることを確認したいと思います。
もう1つは、元のx軸(リーフノードに対応)をy軸に切り替え、元のy軸をx軸に切り替えたいということです。より明確なデモンストレーションの目的で、プロットの上部にもう1つのx軸(切り替えられたプロットの距離情報に対応)を追加したいと思います。Rでこれをどのように行うことができますか?
python - hclusterによって生成されたndarrayをete2パッケージで使用するためのNewick文字列に変換する
次のコマンドを実行して作成されたベクトルのリストがあります。
ここで、document_listは、私が分析しているWebドキュメントのコレクションです。次に、階層的クラスタリングを実行します。
これにより、次のようなndarrayが生成されます。
このndarrayをete2Tree()コンストラクターに渡すことができるnewick文字列に変換して、ete2が提供するツールを使用してnewickツリーを描画および操作できるようにすることは可能ですか?
これを試してみるのも理にかなっていますか?そうでない場合は、同じデータとete2を使用してツリー/樹状図を生成できる別の方法があります(dendropyやhcluster自体などの樹状図を描画できる他のパッケージがあることを認識していますがete2をすべて同じように使用したいですか)?
ありがとう!
python - Pythonのデンドログラム
Pythonでデンドログラムを描画するコードを書きたいと思っています。簡単な方法はありますか。
ポイント データセット内のクラスターを識別するコードを記述しており、反復ごとに生成されたクラスターの量を示すデンドログラムを生成したいと考えています。
たとえば、このデータセットでコードを実行すると、最初の反復で 1 つのクラスターが得られます
および2回目の反復で2つのクラスター
ですから、それを示すものを作りたいと思っています。しかし、どこから始めればよいか本当にわかりません
各ポイントには、各反復後にポイントがあった各クラスターのリストである「ラベル」属性があります。
つまり、この例では、いくつかのポイント ラベル属性は[0,0]
であり、その他は[0,1]
です。したがって、scipy dendrogram を使用する場合、これからどのようにしてリンケージ形式に到達するのでしょうか