問題タブ [dummy-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 四半期ダミーを使用した線形回帰
以下のデータに線形回帰を当てはめようとしています
モデルは
これはうまくいきます。ただし、3 四半期に 3 つのダミーが自動的に作成されます。このモデルに Q2 など、ダミーを 1 つだけ含める方法はありますか?
r - リストからのダミー変数の作成
そのため、フレームの特定の列に特定の単語が含まれているかどうかに基づいて、データ フレームにアタッチするダミー変数を作成しようとしています。列は次のようになります。
そして、各行に含まれる単語に基づいてダミー変数を作成します。たとえば、最初の行には"good", "night",
andが含まれますが、 orは含まれ"moon"
ません。"room", "morning"
"hello"
私がこれまで行ってきた方法は、非常に原始的な方法で、適切なサイズの 0 値の行列を作成し、次のように for ループを使用することです。
または似たようなもの。より高速でリソース効率の高い方法があると思います。何かアドバイス?
rest - MailChimp には、テスト用のダミー データを含むサンドボックス API がありますか?
MailChimp API を使用して、購読者、最後のキャンペーンの日付 (まだ利用可能かどうかは不明)、開封率など、ユーザーのアカウントからいくつかの指標を単純に取得するユーティリティを作成したいと考えています。
私が直面している重大な問題の 1 つは、無料の MailChimp アカウントを持っていますが、そこにはデータがまったくない (リスト、サブスクライバー、キャンペーンなどがない) ため、テストには理想的ではないということです。
だから私はここで私の最良の選択肢が何であるかを知りたい.
- 手動でダミー データを作成する必要があります (たとえば、自分を購読者としてリストに追加してから、自分に電子メールを送信するなど)。
- または、彼ら (MailChimp) は、より豊富なテスト/ダミーデータが既に含まれている「サンドボックス」アカウントを提供していますか? または、
- 他の代替...
PS - この統合タスクには MuleSoft を使用しています (この情報が回答に役立つ可能性があるため、MuleSoft について言及します)。
r - ダミー変数を使用して線形リッジを予測する
ライブラリ内の GenCont データを使用して以下のコードを使用してリッジ回帰を実行しようとしていますridge
しかし、モデルでダミー変数を使用すると、このエラーが発生します
Rのリッジ回帰でダミー変数を予測する方法はありますか?
r - 明確なy変数のない説明的な棒グラフを作成するggplot
ggplot と、ダミー変数の 1 つの列と 14 の異なるレベルを持つ因子変数の 1 つの列である巨大なデータ セットを使用して、比例積み上げ棒グラフを作成しようとしています。ここにデータの小さなサンプルを投稿しました。
私のデータには明確な y 変量がありませんが、多くの観測値を持つ因子を見るだけで本当に役立つプロットを作成できますが、1 つまたは 2 つしかない場合、比率はまったくわかりません。 . 私が使用したコードはこちらです。
ggplot は、データ フレームに ddply 関数を適用する必要があることを示しています。
プロットで呼び出す明確な y 変数がないため、このデータの場合、彼らの例は実際には当てはまりません。1 または 0 の各要素をカウントするだけです。
ddply 関数についての私の最善の推測では、行数の違いに関するエラーが吐き出されます。
php - Web アプリケーションのライブ ダミー データ
私が書いたソフトウェアのライブ デモ バージョンを設計しています。データベースは MySQL を使用してモデル化されており、すぐに使用できるダミー データが付属しています。私がやりたいのは、ユーザーがサインインしてデモを試すときに生成し、ログオフまたはシステムを閉じた後に削除することです。そのような問題を解決するための最良のアプローチは何でしょうか?
numpy - データフレームを成長させるパンダスティックな方法
だから、私は年末年(2013年)を超えていくつかのロジックでインクリメントしたい年インデックス付きのデータフレームを持っています。たとえば、最後の値を10年間nパーセント増やしますが、ロジックは単に定数を追加することもできます、またはわずかに増加している数。それを関数に任せて、そこにロジックを詰め込むだけです。
任意の長さの時間とロジックでそれを行うためのきちんとしたベクトル化された方法を考えることができず、余分な増分が追加された長いデータフレームを残し、ループしないことを好みます。