問題タブ [traminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RでseqIplotを使用してy軸を構成するには?
R パッケージを使用してシーケンス インデックス プロットの y 軸を設定しようとしてTraMineR
います。2 つ以上のシーケンス間で特定のシーケンスの数を比較する場合に役立つ、y 軸のグローバル制限を設定する方法を見つけました。スケールを均等にするため、グループ化します。しかし、y軸の目盛りを設定できませんでした(xtstepのように)。このサンプルコードを使用して、すぐに私を助けることができるかもしれません:
デフォルトのシーケンス インデックス プロットは次のようになり、2 つのグループを比較するのが非常に難しくなります。
traminer - シーケンス回帰ツリーの略語
シーケンス回帰ツリーを使用して、キャリアの軌跡の違いを調べます。プロットとツリーの印刷された説明の両方に、TraMineR ヘルプ メニューにも、Sequence Regression Trees/Weighted Clusters に関する Matthias Studer の論文にも説明されていない略語があります。
以下の例の略語の意味を教えてください (15 年間 (それぞれ 6 か月の 30 期間) にわたる 377 人の参加者の階層的進歩に関する d プロット)?どうもありがとうございました!
印刷出力
質問 1: ディスク = ? (--> プロットの s2 に等しい、以下を参照) 質問 2: [(1,20)-(2,8)-(3,2)] * = ? (これが最も典型的なシーケンスですか?)
プロットされた出力 質問 3: s2 = ? (上記の印刷出力の「ディスク」に相当)
traminer - 長さが異なるシーケンスの可変インデル コスト
最適なマッチング アルゴリズムを使用して、TraMineR でシーケンス分析を行っています。残念ながら、右打ち切りデータのため、シーケンスの長さが等しくありません。私のシーケンスの最小の長さは 5、最大の長さは 11 です。長さの変化は、関心のあるシーケンス間の非類似性には意味がありません。したがって、シーケンス間の全体的な非類似性に対する不等長の影響を次のように保持したいと考えています。できるだけ小さく。
Stovel と Bolan (2004 (1)) で、この問題の可能な解決策を読みました。彼は、シーケンスの長さが等しいかどうかに応じて可変インデル コストを使用しています。そのため、長さが等しいシーケンスには固定インデル コストを使用し、長さが等しくないシーケンスには、「固定コストの約 4 分の 1」の削減コストを使用します。
私の質問は次のとおり です。一般に、欠落は TraMineR でどのようにコーディングされるべきですか? 空要素として、または不足している状態をアルファベットに含める必要がありますか? Stovel と Bolan によって導入されたように、TraMineR に可変インデル コストを適用するオプションはありますか? はいの場合、どうすればこれを行うことができますか?
(1) ストーベル、キャサリン、マーク・ボラン。2004年。社会学的方法と研究 32(4):559-598。
r - TXTファイルからのデータ読み込みとTraMineRでのTSE形式への変換
メモ帳のテキスト ファイルにデータがあります。TXTファイルをTSE形式に変換するのを手伝ってください。
メモ帳のテキスト データ:
日付、時刻、ユーザー、プロセス、アクティビティ
2013-06-25、10:34:21.4375、uni15、1、インデックス
2013-06-25、10:35:13.0156、uni15、1、ItemDetailsPartial
2013-06-25、10 :35:54.9843、uni15、1、CloseItemDetailsPartial
2013-06-25、10:35:59.5781、uni15、1、FilterByTag
2013-06-25、10:36:05.9218、uni15、1、ItemDetailsPartial
r - R/TraMineR のクラッシュを避けるためにタイムスタンプをフォーマットしますか?
エポックからのタイムスタンプが秒単位のシーケンス データセットがあります。
STS
シーケンス オブジェクトを作成したい:
ただし、これを行うと、RStudio がクラッシュし、コンピューター全体が多かれ少なかれフリーズします。「時刻」列に 1 桁の数字を使用する、正常に動作する他のコードと比較することで、問題がタイムスタンプであると特定したと思います。R/RStudio/TraMineR が長いタイムスタンプから単純に過負荷になっている可能性はありますか?
r - 単一のシーケンス オブジェクトでシーケンス全体の属性を要約しますか?
TraMineR
シーケンスのセットを分析するために使用しています。一貫性のあるシーケンスの各セットには、1 つのプロジェクトからの 1 つの期間の 100 の作業プロセスが含まれる場合があります。を使用するTraMineR
と、各シーケンスの記述統計を簡単に計算できますが、シーケンス オブジェクト自体の記述統計にもっと関心があります - すべての小さなシーケンスをその中に含めます。
たとえば、状態の頻度を取得するには、次を実行します。
ただし、これにより、シーケンス オブジェクト内の各シーケンスの状態周波数が得られます。シーケンス オブジェクト内のすべてのシーケンスの状態の頻度にアクセスしたいと考えています。どうすればこれを達成できますか?
r - シーケンスと seqiplot の不一致
関数 seqiplot を使用して、シーケンス インデックス プロットを作成しています。問題は、プロットに表示されているものとシーケンス データの間に矛盾が生じることです。たとえば、期間 t と t+1 に同じシーケンス状態があります。ただし、シーケンス インデックス プロットでは、期間ごとに異なる色が表示されます。それらは同じ色であるべきではありませんか?
データセット内の可能な状態の数に関係していると思われます。60 の異なる状態があります。したがって、配色を設定しようとすると、次のメッセージが表示されます: In brewer.pal(60, "Accent") : n too large, allowed maximum for palette Accent is 8 Returning the palette you requested for that many colors
これは、Accent が最大 8 色であることを示しています (そうではありませんか?)。
誰かが同様の問題を抱えていましたか?どうすれば修正できますか?
よろしく、
フランシスコ。
r - TraMineR コマンドの高速化
私はこの形式で構造化されたデータを持っています (より長いですが、まだ省略されています。データセットはここにあります):
次のライブラリをロードします。
この関数を使用してロードします(これは迅速です):
次に、この関数を実行してシーケンスの長さを計算します (非常に遅い)。
ただし、これは骨の折れるほど遅いです。コードをリファクタリングして高速化する方法について何かアドバイスはありますか?
タイムスタンプの中には数千ステップ離れているものもありますが、各シーケンスの長さはほんの数ステップです。異なるシーケンスのタイムスタンプ間の大きな距離が、長い計算時間 (大学のスーパーコンピューターで 20 時間以上) の原因になる可能性はありますか?