問題タブ [recode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rで変数を折りたたむ/再コーディングする方法
私は R の入門クラスにしか参加していないので、これはおそらく非常に基本的なものです。
私は Outlook on Life データセットを使用しており、Income に興味があります。回答者は、次の 19 の選択肢から 1 つを選択する必要がありました。
プロットをよりわかりやすくするために、これを折りたたんで次のように単純化します。
- 貧困ライン以下 ($0 - 24,999),
- 労働者階級 ($25,000 - 34,999),
- 中産階級 ($35,000 - 60,000)、
- 中産階級 ($60,000 - 100,000),
- アッパーミドルクラス ($100,000 - 150,000),
- 上位 5% ($150,000 +)。
これを再コーディングするにはどうすればよいですか?
ありがとうございました!
r - R - 再コーディングのアドバイスに一致
私は明らかに簡単なことをするのに苦労しています。
コードとその再コーディングのリストがあります。
次に、 という名前の再コード化が必要なベクトルがありますttest
。
必要なのは、再コード化する必要がある値から単純に再コード化するcodesTv
ことです。
しかし、これを行う唯一の方法は、次の面倒なコードです。
誰かがこれを行うためのより簡単なアイデアを持っていますか?
データ
loops - SPSS 構文: ネストされたループで再コーディング
入れ子になったループ (SPSS 構文) での再コード化に関する私の問題を解決できることを願っています。:)
私の SPSS データベースには、さまざまな薬の血中濃度測定値 (20 週間にわたって週に 3 回) があります。recode を使用して各物質の新しい変数を生成し、各物質の箱ひげ図を作成したいと考えています。
次のプロセスでは、1 つの物質のプロセスについて説明します。1つの物質の解決策を持つ残りを抽象化できます。
GUI経由でクリックする方法がありますが、これは非常に多くの測定で非常に疲れます-そしてエラーが発生しやすい-ので、SPSS構文でこれを行いたいと思います.
念のため: 20 週間 (0-19) にわたって、週に 3 回の測定 (1-3)。
最初の週の最初の測定の RECODE は次のようになります。
これを Python または PHP で実装したい場合は、次のようになります (疑似コード)。
私の基本的なアイデアは、ネストされたループと内側のループで再コードを実行することでした。$i と $j は整数になるため、文字列にキャストして条件をチェックする必要があります: (疑似コード)
私は SPSS 構文にあまり詳しくありませんが、これがどのように機能するかについての私の基本的な考えです。私が必要としているのは、私の PHP/Pythonish 疑似コードの実際に機能する構文コードです。:-)
stata - パネル ID 名の変更を経時的に追跡する
英数字コードとして保存されている会社名であるパネル識別子があり、パネル全体で名前の変更を追跡したいと考えています。たとえば、2001 年 5 月 25 日に会社 A は B に名前が変更され、2003 年 5 月 25 日に会社 B は C に名前が変更されます。次に、2005 年 5 月 25 日に会社 C は D に名前が変更されます。この例では、会社 D、E、および G の名前は変更されません。
会社 A が後日、新しい名前で何らかの取引に関与しているかどうかを確認できるように、「遷移マトリックス」が必要です。たとえば、テスト データの最初の行では、企業 A と G は 2001 年 8 月 12 日に発表された取引に関与していますAA
。AA
社名はB(2001年5月25日変更)。テスト データの 2 行目では、B と H が 2001 年 8 月 12 日に発表された取引に関与してAA
います。しかし、再度変更する時間がないため、会社の名前は B のままです。
以下のコードはこれらの名前の変更を追跡しますが、このアプローチはあまりにも機械的であり、まだ検討していないシナリオに対して堅牢ではないのではないかと私は疑っています。
私が従うべきより論理的なアプローチ、またはこの再コーディングを処理するコマンドはありますか?
r - データフレーム内のベクトル全体で数値を NA 値に再コード化する方法
いくつかの数値変数を含むデータ フレームがあります。関心のある数値を含む列の値を比較して行を並べ替える並べ替えアルゴリズムを作成しました。
値は数値形式の YYYYMMDD です。ただし、実際には NA である必要がある値として 0 (ゼロ) を持つエントリもあります。これは、たとえば 20001224 と 0 の間で比較が可能であることを意味しますが、0 は適用できない値であるため意味がありません。
strptime を使用して値を日付に変換し、日付以外を取り除くことができました。ただし、データ フレームの複数の列を NA 値に再コード化する方法を理解しようとして、ここに質問として投稿したいと思いました。
列ごとに移動し、すべての 0 (ゼロ) を NA に再コード化する簡単な方法 (適用関数の 1 つを使用) が必要です。
ここに私のデータの抜粋のdputがあります: