問題タブ [strsplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - strsplit(...) テキストベクトルを R でチャンクに分割する
私の小さなプロジェクトのために私を助けてください。
テキスト要素の大きなリストを用意します。各要素は、文の小さなリストに分割する必要があります。各小さなリストは、元のテキスト要素と同じ位置 (「行」) で最初の大きなリストの新しい列に 1 つの要素として「保存」する必要があります。
分割基準は"/$"
、"und/KON"
、"oder/KON"
です。これは、新しい small-list-element の先頭に保持する必要があります。
のような正規表現と、"/$|und/KON|oder/KON"
エスケープの多くの組み合わせを"$"
試しました。また、パラメータを変更しようとしました。私が注意しようとするたびに起こります。が正しく解釈されていないようです。問題を解決するために何をお勧めしますか?"|"
"/"
perl = TRUE
fixed = TRUE
FALSE
|
regex - R: 複数の正規表現パターンと例外でテキストを分割する
text
文中の文字要素のベクトルを分割したいと思います。分割基準のパターンが複数あります ( "and/ERT"
、"/$"
)。また、パターンからの例外 ( :/$.
、and/ERT then
、 ) があります。./$. Smiley
試行: 分割する必要があるケースを一致させます。そこに変わった模様("^&*"
)を入れます。strsplit
特定のパターン
問題: 例外を適切に処理する方法がわかりません。"^&*"
通常とは異なるパターン ( ) を削除して、実行前に元のテキストを復元する必要がある明示的なケースがありますstrsplit
。
コード:
r - strsplit を可変数の列に分割する
これは、以前に尋ねたこの質問の続きです: R for loop: create a new column with the count of a sub str from a different column
私は大きなテーブルを持っています(100以上の列、50k以上の行)。列の 1 つには、次の形式のデータが含まれています。
私は行きたい:
記入する必要がある列は 3 つ以上あります。例としてこれを削除しました。私のスクリプトは、入力する適切な数の列を作成します。コードが必要なだけです。これは for ループであると想定し、「col」の文字列を「,」で分割し、分割された文字列を後続の列に配置します。
助けてくれてありがとう!
r - Rのstrsplit:カンマで区切られた1列のデータを複数の列に分割するにはどうすればよいですか?
私はウェブサイトからデータを読んでいます: https://raw.github.com/johnmyleswhite/ML_for_Hackers/master/02-Exploration/data/01_heights_weights_genders.csv
(1) 最初に、次のコードを使用してデータを R に直接読み込もうとしました。
しかし、次のエラーを受け取りました。
そのため、データを .csv ファイルにコピーしただけです。このファイルを「Raw_Data.csv」としてディレクトリに保存しました。ただし、データはすべて 1 つの列にあります。
(2) 次のコードを使用して、このファイルを R に読み込みます
私がやりたいのは、この 1 つの列を 3 つに分割し、列名を「性別」、「身長」、「体重」とすることです。私が試したのはこれでした:
ただし、次のエラーが表示されます。
よろしくお願いします。
arrays - Matlab strsplit エラー
5574x1 セル配列である data という変数があります。現在、各要素は文を表す文字の配列です。各配列を空白で分割したい。だから私はこれをやってみました:
new_data = {strsplit(データ{:})}
そしてMatlabは私にこのエラーを与えます:
ただし、これを行うと:
それはうまく動作します。2つの違いが何であるかを理解できないようです。最初のものはなぜ機能しないのですか?どんな助けでも大歓迎です。
r - Rでstrsplitを使用してコンマ区切りの混合テキストと数値文字列を分割する
name1, name2 and name3, 0, 1, 2
orの形式の文字列が多数ありname1, name2, name3 and name4, 0, 1, 2
、ベクトルを 4 つの要素に分割したいと考えています。最初の要素は名前のテキスト文字列全体になります。問題は、strsplit がテキストと数値を区別せず、最初の例では文字列を 5 つの要素に分割し、2 番目の例では 6 つの要素に分割することです。可変数の名前を持つ文字列のテキスト部分を動的にスキップするように R に指示するにはどうすればよいですか?
string - コンマ区切りの文字列を複数の列に分割し、nospace に 0 を割り当てる
次の形式のテキスト文字列 (各文字列内にコンマで区切られた 6 つの値 (0 から 100) を持つ) を含む私data.frame
のベクトルでは:x
これは私が問題を抱えている実際のベクトルへのリンクです: x.cvs
x.cvs
残念ながら、「0」の値は、2 つのコンマの間、または最初のコンマの前、または最後のコンマの後に「空白なし」として記録されます。
最初に次のように変換できるとよいでしょう。
しかし、最も重要なことは、このベクトルを 6 つの異なるベクトル x1、x2、x3、x4、x5、x6 に分割し、それぞれが文字列から値を取得し、カンマ間の「スペースなし」を「0」に置き換えることです。 、たとえば、結果は次のようになります。
カンマの間に値があれば strsplit() は機能したと思いますが、値がなく、空のスペースでさえないため、NAを取得せずに続行する正しい方法がわかりません。
次のことを試しましたが、多くのエラーが発生します。
エラーが出ます...
regex - | で列を分割する方法 複数の列に
R: 多数の行からなるデータフレームがありますが、列は 1 つしかありません。各行には長い文字列があり、定期的に | で区切られています。マーク。| があるたびに文字を分割したい マークを付けて、列が多くなるようにします。
各文字列は日付で始まり、都市に対応する数字が続きます。変数名も 1 つの文字列としてリストされ、"." で区切る必要があります。マーク。
どんな助けでも大歓迎です!