問題タブ [stringr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - パスからのみ file/folder_name を抽出するにはどうすればよいですか?
残念ながら、私は正規表現が苦手です。次のようなパスがある場合:
/long/path/to/file
、抽出するだけですfile
。
誰かがfile/
私に必要なものを提供する場合file
。
誰かが を供給/file/
してくれても、まだ だけ必要ですfile
。
stringr
関数を松葉杖として使用してきましたが、これはまっすぐなgrep
領域のようです。助けてください?
r - 文字列から 2 文字を削除する
関連する質問はこちら.
したがって、ドル記号とコンマの両方を含む通貨値を持つ文字ベクトルがあります。ただし、同じ手順でコンマとドル記号の両方を削除しようとしています。
これにより、ドル記号が削除されます =
これによりコンマが削除されます =
両方の文字を一度に削除できるかどうか疑問に思っています。
gsub の結果を新しい変数に保存してから、その変数 (または別の関数) をその変数に再適用できることに気付きました。しかし、両方を行うための単一のステップについて疑問に思っていると思います。
r - R count 回単語がリストの要素に表示されます
単語で構成されたリストがあります。
リスト全体の合計出現回数ではなく、リストの各要素の出現回数をカウントしたい単語のベクトルがあります。
パッケージの機能と機能の1つをstr_count()
組み合わせる方法だと思いますが、機能させることができません。stringr
*ply()
ここで、"we" は最終的に の出現回数をカウントする単語のベクトルからの単語になります。
私の理想的な出力は次のようになります。
助言がありますか?
regex - Rregexgsub個別の文字と数字
文字と数字が混在する文字列があります。
次のように、数字の直後に文字が続く文字列を分割したいと思います。
私はこれを試しました:
しかし、望ましい結果が得られていません。
助言がありますか?
regex - 両方が存在する場合にのみ、先頭と末尾の文字列から引用符を削除します
エスケープされた引用符を含む文字列をクリーンアップしたいと考えています。文字列の末尾と先頭のエスケープされた引用符を削除したいのですが、文字列内のすべての引用符はそのままにします。私が思いついたのは次のとおりです。
私が今苦労しているのは、引用符が最初と最後にある場合にのみ、引用符を削除したいということです。次の式は、先頭の式を誤って削除します。
ここで、正規表現は、文字列全体がエスケープされた引用符で囲まれている場合にのみ削除することを示しているはずです。どうやってやるの?
regex - 単一の置換を伴う正規表現の複数のパターン
私は両方の「st」を置き換えようとしています。と「ステ」。「st」で。次のように動作するはずですが、動作しません。
regex - 複数のパターンと複数の置換をもつ str_replace 文字ベクトル
重複の可能性:
条件付き gsub 置換
文字ベクトルの特定の要素を定義済みの置換で置き換えるにはどうすればよいですか?
これは単純なはずですが、私は長い間いじっていて、理解できません。どんな援助でも大歓迎です。
regex - 正規表現を使用して R で繰り返されるフレーズを抽出する
以下のコードを使用して、繰り返されるフレーズを検索 (抽出) しようとしています。「およそ」で始まり「クローズ」で終わるフレーズが必要です。
たとえば、「総資産で約 1 億 6,290 万ドル、総預金で 1 億 4,450 万ドルが閉鎖されました」
str_locate(x,"(\b[Aa]pproximately\b)(.*)(\b[Cc]losed\b)")
上記のコードは、フレーズの開始点と終了点に対して NA を返します。フレーズが配置されている文字ベクトルのサンプルを次に示します (公開されている FDIC 情報の Web ページです)。
"206-4662).\r\n\r\n12 月 \r\n\r\n\r\n 総資産約 1 億 6,290 万ドル、総預金額 1 億 4,450 万ドルのウエスタン ナショナル バンク、フェニックス、アリゾナ州が閉鎖されました。ワシントンワシントン州シアトルのフェデラルは、特定の仲介預金を除くすべての預金を引き受けることに同意しました。\r\n(PR-195-2011) \r\n\r\n\r\n\r\n エメラルド コーストのプレミア コミュニティ バンク、総資産約 1 億 2600 万ドル、総預金額 1 億 1210 万ドルのフロリダ州クレストビューが閉鎖されました。フロリダ州パナマシティのサミット銀行は、すべての預金を引き継ぐことに同意しました。\r\n(PR-194-2011)"
私はそれに慣れていないので、正規表現を間違って使用している可能性があるので、アドバイスをいただければ幸いです。
r - str_match(...、regex)を使用して複数のキャプチャグループを照合する方法
パッケージから使用str_match
して、stringr
角かっこで囲まれたテキストをキャプチャしています。
一致"abcde"
と。のみを表示し"abcdef"
ます。"fghij"
両方の文字列に同じ正規表現を使用して、同様にキャプチャするにはどうすればよいですか?
xml - R で文字ベクトルからデータ フレームを作成する
Webページから取得したテキスト形式のデータがあります。かなり長いですが、次の形式に従います。
次のように、この関連部分をデータ フレームに抽出したいと考えています。
・・・でも、どうしたらいいのかわからない。text という文字ベクトルに html がある場合、stringr パッケージの関数を使用してmonthyearデータを抽出できます。
同じ方法でinfoとnデータを抽出できましたが、月と年のエントリごとに複数のinfoとnエントリがあるため、それらを組み合わせる方法がわかりません。私はこれについてすべて間違っていますか?