“tidyr”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

2625 参照

r - 分割を使用して 1 つの列を 2 つ以上の列に分割しようとしています

私は R が初めてで、Kaggle の Titanic データセットを使用して練習しています。姓、名、敬称、その他の情報を別々の列に分けて、乗客の年齢 (大人または子供) を分類しようとしています。

以下は、Train データセットのサンプルデータです。

以下は、Name を含むサンプルです。

次のコードを使用して、姓を列の残りの部分から分離できます。

ただし、名のフィールドを追加しようとすると:

次のエラーが表示されます。

間違った構文を使用していますか、または 1 つの列から 3 つのフィールドを使用できませんか?

r dplyr tidyr kaggle

2014-10-06T20:53:02.307

0 投票する

1 に答える

2381 参照

r - tidyr で変数を使用して gather_ を使用する方法

私は光沢のある tidyr と一緒に使用しているため、tidyr 操作で動的な値を利用する必要があります。ただし、gather_() の使用には問題があります。これは、そのような場合のために設計されたものだと思います。以下の最小限の例:

いくつかのデバッグの後、melt measure.vars 部分でエラーが発生したことに気付きましたが、そこにある ':' でそれを機能させる方法がわかりません...解決策を手伝って、少し説明してください。 .

r melt tidyr

2014-10-17T16:37:12.010

0 投票する

3 に答える

26449 参照

r - ギャザー (tidyr) とメルト (reshape2) の比較

私はreshape2パッケージが大好きです。通常、Hadley は以前のパッケージに改善を加え、合理化されたより高速なコードを実行できるようにしました。私はtidyrに旋風を巻き起こし、読んだことからreshape2gatherに非常に似ていると思いました。しかし、ドキュメントを読んだ後、同じタスクを実行することはできません。meltgathermelt

データビュー

dputこれがデータのビューです（投稿の最後のフォームの実際のデータ）：

コード

meltこれがファッションのコードですgather。gatherと同じことを行うにはどうすればよいmeltですか?

望ましい出力

データ

r reshape2 tidyr

2014-10-23T19:51:18.770

0 投票する

1 に答える

228 参照

r - R データ内の文字列から引用を削除する

私はウィキペディアから税金データを引き出し、再結合に取り組んでいましたが、データから引用タグを削除するのに問題があります ( http://en.wikipedia.org/wiki/List_of_countries_by_tax_rates#Countries )。最初に、 [ で strsplit を使用して削除しようとしましたが、これが得られました。

最終的に、引用を削除したいと思います（番号付きまたは「引用が必要」であり、それらを囲む括弧）。名前だけを保持できるように、2 番目の列に数字を、最初の列に国名を入れたいと思っていましたが、脚注がない場合は列が混在してしまいます。私も使用を検討しましcSplitたが、そのアプローチでも成功しませんでした。助言がありますか？

r string citations tidyr

2014-10-26T21:48:13.440

0 投票する

1 に答える

629 参照

r - データフレームの再形成

行名を持つこの乱雑なデータフレームがあるとします

A列、B、およびCが単一の列に折りたたまれ、の追加の列があるように、きちんとした形式にしたいと思いますGender。このように見えるかもしれません

を使用してこれを実現する 1 つの方法を次に示しtidyrます。

しかし、かなり洗練されていない方法で行名を列に変換する必要がありました。私の質問は、これに役立つ、tidyrまたはreshape役立つ追加機能は何ですか? gatherまたは、この結果を 1 行で達成するために、私の呼び出しが別の方法で行われた可能性はありますか?

r reshape tidyr

2014-11-05T18:39:10.977

0 投票する

3 に答える

2322 参照

r - 異なる長さのベクトルを持つ tidyr からの分離の使用

[1, 58, 10] などの文字列の列を、separate from tidyr を使用して列に分割したいと思います。私の問題は、列が短い場合があることです（決して長くはありません）。同じデータフレームに、この問題が発生した列が多数あります。

パッケージの読み込み

データ

ここでは、実際のデータからのサンプルを使用してデータフレームを作成します。「ベクトル」の長さは、col1 では 10、col2 では 9 または 10 です。他の列があることを示すためだけに時間列があります。

どうなりたいか

すべての「ベクトル」が同じ長さの最初の列では、separate() を使用して必要なものを取得できます。

これにより、

これは、要素を複数の列に分割できない col2 では機能しません

回避策

その結果、

ベクトルが短い場合、最後の要素は NA になるため、これは正しいです。

質問

回避策の代わりに別の (または他の単純な関数) を使用する方法はありますか? これを col1 と col2 に同時に適用する方法はありますか (たとえば、col で始まる列を選択することによって)?

ありがとう！

r dplyr stringr tidyr

2014-11-07T15:33:21.553

0 投票する

1 に答える

95 参照

html - Reshape2 で HTML テーブルをきれいにする

R の新規ユーザーです。質問の仕方すら考えられません。HTML テーブルの Web ページをスクレイピングしました。一般的に、1 つのテーブルを除いて、すべてがうまくいきました。7 つの個別のテーブルが存在する代わりに、すべてが 1 つのテーブルに折りたたまれ、最初のテーブルの列名と値が 2 つの個別の列になり、他のすべてのテーブルは行になります。結果は、次のようなテーブルです。

明らかに、最初の列の行 (および列名) を独自の列として、2 番目の列の項目を値として、できれば列名にアンダースコアを使用する必要があります。私は試した：

しかし、エラーメッセージが表示されました。次に、別の列を追加することを考えました。

それから私は試しました

これにより、最初の列の値が独自の列として配置されましたが、NA を持つ 2 つの行 (1 ではなく) が生成されました。これは本当に基本的なことだと確信していますが、理解できません。

編集時:これで欲しいものが得られると思いますが、コンピューターから離れているため確認できません:

追加する必要がある nか、NA を取得する必要がありますが、好きではありません。

html r tidyr data-cleaning reshape2

2014-11-12T09:39:53.773

問題タブ [tidyr]

Reference