問題タブ [dummy-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
7738 参照

python - Python scikit-learnランダムフォレストでカテゴリデータを表すためにダミー変数を使用する方法

scikit-learn のランダム フォレスト分類器の特徴ベクトルを生成しています。特徴ベクトルは、9 つ​​のタンパク質アミノ酸残基の名前を表します。可能な残基名は 20 あります。したがって、1 つの残基名を表すために 20 個のダミー変数を使用します。9 個の残基の場合、180 個のダミー変数があります。

たとえば、スライディング ウィンドウ内の 9 つの残基が ARNDCQEGH (すべての文字がタンパク質残基の名前を表す) である場合、私の特徴ベクトルは次のようになります。

また、 (1,0) を使用して (True,False) を置き換えようとしました

Scikit のランダム フォレスト分類子モデルをトレーニングしてテストした後、完全に機能しないことがわかりました。しかし、Scikit のランダム フォレストは、他の数値データでも機能します。

Scikit のランダム フォレストは、カテゴリ変数またはダミー変数を処理できますか? もしそうなら、それがどのように機能するかを示す例を提供できますか.

ランダムフォレストの設定方法は次のとおりです。

よろしくお願いします!

0 投票する
2 に答える
5124 参照

r - R クエリ: カテゴリ変数からダミー変数を作成する

スタック オーバーフローの皆さん、こんにちは。問題の解決策をしばらく探しましたが、何も見つからなかったので、投稿しようと思いました。

基本的に、アルファベット順にリストされた 196 か国のデータセットがあります。変数の 1 つは、その国の地域に応じて 1 ~ 10 の数字を割り当てます。たとえば、東ヨーロッパ = 1、西ヨーロッパ = 2、中東 = 3、南アメリカ = 4 などです。

データセットの視覚的表現を次に示します。

国名------国の地域------乳児死亡率

アフガニスタン------------3----------------------------180

アルゼンチン ---------------4------------------------65

フランス------------------2----------------------------12

ドイツ---------------2------------------------10

ポーランド------------------1-----------------------------------16

私がする必要があるのは、10 の地域をそれぞれのダミー変数に分割して、多変量回帰を実行して乳児死亡率に対する個々の効果を判断することです。

ダミー変数 (1 = 東ヨーロッパ、0 = その他) を作成するために必要なコードと、それらの効果を個別および多変量回帰の両方でテストする方法を考えていました。

これが単純またはばかげた質問のように思われる場合は申し訳ありませんが、私はRを使用するのにかなり慣れていません.

事前に助けてくれてありがとう。

編集:これは、要求された dput 出力です。

0 投票する
2 に答える
6774 参照

regression - Stata: 11,000 を超えるダミー変数を使用した線形回帰

11,000 を超えるダミーの相互作用用語を使用してパネル回帰を実行しようとしています。私の回帰は次のようになります。

ここでi.county*i.year、ダミー変数の相互作用を表します。Stata も Matlab も R も、これほど多くの変数を保持することはありません。保存されている変数の数を増やすコマンド (たとえば、stata の -set matsize- コマンド) が不足しているかどうかはわかりません。

私は、Stata マトリックスの最大容量が 11,000 変数であることを知っています。この固定効果回帰を Stata で実行するにはどうすればよいですか? ここでMataはオプションですか?

0 投票する
1 に答える
3020 参照

sql - 後で値を追加するために CTE 内の select ステートメントに列を追加する方法

CTE にダミー列を追加したい。

後で update ステートメントを使用してダミー列の値を更新したいと思います。

派生フィールドまたは定数フィールドが含まれているため、ビューまたは関数の更新または挿入が失敗しました。

CTEは

update ステートメントを使用して F フィールドを更新すると、例外が発生します。

0 投票する
0 に答える
193 参照

python - プログラムでダミーのメール スレッドを作成する方法は?

いくつかのソフトウェアを比較するために、メールのスレッドが必要です。つまり、返信のあるメールと返信への返信が必要です...

このようなダミーのメール スレッドをプログラムで (できれば Linux コマンドライン ツールまたは Python を使用して) 作成する方法を知りたいです。

これらのダミーメールを作成するにはどうすればよいですか?

0 投票する
1 に答える
179 参照

android - 外部ストレージandroidのファイルにダミーコンテンツを書き込む

以下のコードでは、「testfile.txt」というファイルにダミーの内容を書き込んでいます。しかし、外部ストレージのいずれかのファイルにダミーの内容を書き込みたいです。ファイル名をハードコーディングしたくありません。私はどのように行いますか?

0 投票する
0 に答える
609 参照

android - 外部ストレージandroidの選択ファイルにダミーデータを書き込む

以下のコードでは、外部ストレージに存在するすべてのファイルにダミー データを書き込み、名前を「abc.txt」に変更しています。しかし、私が望むのは、選択したファイルにのみダミーデータを書き込み、その特定のファイルの名前を変更することです。私はどのように行いますか?

0 投票する
3 に答える
8777 参照

r - R でバイナリ インジケーター マトリックス (ブール マトリックス) を作成する

次のような会議への出席を示すデータのリストがあります。

次の形式のバイナリ インジケーター出席マトリックスを作成したいと思います。

Rでこれを行う方法はありますか?