問題タブ [stringr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
string - R では、データ フレーム データを使用して文字列のセクションを消去します。
次のようなデータフレームがあります。
これらの開始/終了オフセットのペアで消去したいコンテンツを含む文字列があります。したがって、バイト オフセット 232 と 234 の間にあるものは何でも、「消去」してスペースを縮小したいと考えています。文字列を逆方向に処理したいことがわかったので、最後に変更しても、先頭に近いオフセットは引き続き有効です。私がこれまでに持っているコードは次のとおりです。
しかし、後でscを印刷すると、削除したいすべての部分文字列の最初の文字だけが削除されます。誰かが私が間違っていることについて何か考えがありますか? さらに、これはベクトル化できますか?
更新- stringr の str_sub を使用してみました:
したがって、明らかに、R での文字列処理で何をしているのか理解できません。
regex - 2 つの異なるパターン間の文字列の一部を抽出する
stringr
パッケージを使用して、2 つの特定のパターンの間にある文字列の一部を抽出しようとしています。
たとえば、私は持っています:
str_extract(string, pattern)
関数 (パターンはPOSIX 正規表現で定義されます) を使用して、次の情報を受け取りたいと思います。
Google のソリューションは機能しませんでした。
string - 文字ベクトルを個々の文字に分割しますか? (paste または stringr::str_c の反対)
R の信じられないほど基本的な質問ですが、解決策は明確ではありません。
文字のベクトルを個々の文字、つまりpaste(..., sep='')
またはの反対に分割する方法はstringr::str_c()
?
これよりもぎこちないもの:
strsplit()
、または他のものなど、他の方法で行うことはできstringr::*
ますか?
regex - stringr 英字と数値で列を分割
ストリンガー/正規表現のみを使用できます。rで作業しています
ダウンロードした mpg2 という名前の csv があります。このサブセットには、メルセデス ベンツ製のみが含まれています。私がやろうとしているのは、モデルをアルファと数値に分割して、それらをプロットできるようにすることです。たとえば、メルセデス C300 は C と 300 に、GLS500 は GLS と 550 に分割する必要があります。
これですべてのモデル番号を取得できたので、文字と数字に分けたいと思います。
私が試してみました
しかし、これは私が望んでいることではなく、 n= で遊んだことがありますが、それもうまくいきません。で、〜がある
数字だけの列を作成すると、文字が機能しません。特定のデータセットをアップロードする必要がある場合は、お知らせください。その方法を理解する必要があります。
しかし、基本的に「XYZ123」を英数字部分に分割し、2 つの別々の列に配置する必要があります。
r - 複数の単語を使用して文字列ベクトルを再コーディングする
次の 2 つのベクトルがあります。
vector1 が vector2の少なくとも1 つの単語と一致するかどうかを確認したいと考えています。結果は次のようになります。
1つ1つやり方が分かっているので、
しかし、すべてを同時に行う方法が必要です。単純な質問であることはわかっていますが、直接対処できる答えは見つかりませんでした。
どうもありがとう、
r - stringrを使用して分類内の各単語の数を見つける
2 つの単語セットを文字列の数と一致させようとしています。2 つの単語セットは car と school で、stringr パッケージを使用して、car または school のいずれかの単語のインスタンスに一致するように設定しました。
素晴らしい、それはうまくいきます。
ここで、戻って、車と学校の「バケツ」内の各単語の頻度を簡単にカウントできるかどうかを確認したいと思います。
したがって、次のようになります
車の分類にある本田は 1 回出現するため、度数は 1 です。同様に、学校分類にあり、2 回出現するオハイオ州の頻度は 2 です。
分類の一致から分類内の各単語の頻度を見つけるまで、誰でも手伝ってくれますか?
おそらく戻って、 car の各単語を独自の str_c として設定し、そのように一致させることもできますが、「より単純な」ルートを見つけたいと思います。