問題タブ [traminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - クラスター ソリューション内の 1 つのクラスターのシーケンス頻度プロットを作成する方法
私の問題に対する十分な答えが見つかりませんでした。おそらく誰かがここで助けてくれますか? (私はRの初心者です)
シーケンス分析を行います。状態空間は n = 10、時間空間は t = 168 (月) です。8 つのクラスターを持つクラスター ソリューションのシーケンス頻度プロットを描画しました。ただし、単一のプロットがあまりにもクリンチされているか小さすぎるため、プロットは解釈に対して実際には開かれていません。(下のグラフを参照)
これまでに次の手順を実行しました (TraMineR ヘルプ ドキュメントの手順に非常に近い)。
マージンを再構成しようとしましたが、結果は常に同じプロットでした (添付のプロットはデフォルト設定で行われました)。そこで、代わりに、8 クラスター ソリューション内の単一クラスターのシーケンス頻度プロットを描画できるのではないかと考えました。(Stataコードでは、単一のシーケンスインデックスプロットのようなものを書きますsqindexplot if cluster8 == 4
)しかし、Rでこれがどのように行われるかはわかりません。誰かがよりきれいなシーケンス頻度プロットを取得する方法を知っているなら、私はとてもありがたい!ありがとうございました!オリバー
r - Rでseqplotを使用してx軸を構成するには?
シーケンス プロットの y 軸に関する別の質問に続いて、R パッケージを使用してシーケンス プロットの x 軸を操作する方法を探していますTraMineR
。
問題はTraMineR
、x 軸を指定して調整する簡単な方法が同梱されていることxtstep=
です。ただし、ティックの数、ティック ラベル、およびスケールの終了/制限を互いに独立して指定することはできないため、x 軸を完全に制御することはできません。場合によっては、このサンプル コードを使用したり、以下の 2 つの画像を参照したりするとわかるように、これは優れた機能である可能性があります。
xtstep=1 を使用したシーケンス インデックス プロット
xtstep=12 を使用したシーケンス インデックス プロット
r - TraMineR サブシーケリストのデータ フレームへのエクスポート
私は R と TraMineR の両方にかなり慣れていないので、助けを求めています。現在、クラス「subseqelist」を介して結果セットを取得しています。R でさらに操作を行うには、その結果セットをデータ フレームに取得する必要がありas.data.frame()
ます。
何が起こっているのかを明らかにするのを手伝ってくれる人はいますか? よろしくお願いします。
r - ウェイトを使用した TraMineR
私はまだ慣れていTraMineR
ません。したがって、私の問題はほとんどの人にとって非常に単純かもしれません。私は自分のデータを使用していくつかのシーケンス プロットに取り組んでおり、調査の重みと名目上の重みで結果を確認したいと考えています。データを R にインポートし、データをそのまま使用してシーケンス プロットを実行することはできますが、重みを付けて実行することはできません。ステート シーケンス オブジェクトの作成方法に関する構文 (かなりナイーブ) と 2 つのシーケンス プロットの例を含めました。重みを使用する構文をどのように記述すればよいですか? ありがとう
データ ファイル: DISDATAC
; 調査の重み: WTSURVY
; 公称重量: NORMWEIGHTS
r - 空間自己相関変換に基づく置換行列
置換コストが観察されたシーケンスの置換率に基づくのではなく、さまざまな状態の研究領域内の空間的自己相関に基づくハミングシーケンスの類似性を測定したいと思います (したがって、状態は DNA に関連していませんが、他の何かに関連しています)。
研究エリアを同じサイズ (たとえば 1000m) のグリッド セルに分割し、隣接するセル (Rook-case) で同じ「状態」が観察される頻度を測定しました。したがって、重み行列は、状態A
から(同じ状態内で移動する) は、からまたはへまたはへA
行くよりもはるかに高い確率を持つことを示します。これは、州の空間的自己相関が高いことをすでに示しています。A
B
B
C
A
C
問題は、シーケンスの類似性を測定したい場合、置換行列が0
対角にある必要があることです。したがって、「自己相関行列」から0
対角線に沿った値を持つ置換行列への変換のようなものがあるかどうか疑問に思っていました。これにより、配列類似性測定における研究領域の空間的自己相関を説明したいと思います。分析を行うために、パッケージを使用していますTraMineR
。
4 つの状態 (A、B、C、D) から構成されるシーケンスの R のマトリックスの例: シーケンスの例:AAAAAABBBBCCCCCCCCCCCCDDDDDDDDDDDDDDDDDDDDDDDAAAAAAAAA
自己相関行列:
この行列を置換行列に変換する方法は?
r - 回帰木から各リーフ内のシーケンスを識別する方法は?
biofam データセットの使用
回帰木を適合させて表示できます。
次に、リーフ メンバーシップを識別できます。
しかし、これは私が混乱するところです。プロット内のどの葉に対応する葉の番号を知るにはどうすればよいですか? グラフには表示されないようで、実行print(seqt)
してもリーフ番号が表示されないようです。
私が達成したいのは、各リーフのシーケンスを分離して、各リーフで個別に記述を実行できるようにすることです。どうすればこれを達成できますか?
r - 平均時間プロットの正確な値を与える (seqmtplot)
クラスターをさらに分析するために定義したさまざまな状態ごとに、平均時間プロットの正確な値を抽出したいと考えています。平均時間プロットでは、これらの値を簡単に読み取ることができません。これらの値を抽出する方法はありますか?
ここに、R で利用可能な TraMineR で利用可能な mvad データセットを使用したサンプル スクリプトがあります。
前もって感謝します、ヨハネス
r - サブシーケンスへの最も一般的な部分文字列の検索
最も一般的な部分文字列 (すべてのイベントが隣接している IE サブシーケンス) を見つけるためにシーケンスを検索しようとしています。ユーザーガイドには、サブシーケンス検索ツールについて次のように記載されています。
「サブシーケンスのアイデアは、サブストリングの概念の拡張であり、たとえば Elzinga (2008) で詳細に説明されています。シーケンスのサブストリングは必然的に隣接するシンボルで構成されますが、この要件はサブシーケンスの概念で緩和されます。したがって、 x = abac の場合、λ (空の文字列)、u = b、v = bac、および w = bc は x の部分列のセットに属しますが、λ、u = b、および v = bac のみが x の部分文字列です"
その緩和をオフにして、部分文字列のみを見る方法はありますか? これは特にseqefsubコマンドを使用しています。TraMineR マニュアルでこれについて何も見つけることができないので、これに関するヘルプをいただければ幸いです! どうもありがとう、アンドリュー