問題タブ [stringi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - stri_replace_all_regex は、インポートされたパターン置換ファイルからの結果を受け入れません
約 100 の用語を検索して置換する AppleScript があります。正規表現の使用。この検索と置換関数を R にインポートしたいのですが、ScriptEditor で AppleScript をテキスト ファイルとして保存し、readLines() を介して R にインポートしました。このインポートの dput() の結果は、以下の punct.out のようになります。インポート (以下の punct を参照) からではなく、生のベクトルからパターンと置換の独自のデータ フレームを作成すると、テスト文字列 (以下の test を参照) の検索と置換がうまく機能します。しかし、インポートしたデータ フレームで同じコマンドを実行すると、機能せず、NA が返されます。
どういうわけか、インポートされたテキストの結果は、どういうわけか正規表現として、または文字ベクトルとして解釈されていません...私はそれを理解できません。
2番目の問題:以下のコメントに基づいて上記の問題を解決しました。しかし、いくつかの正規表現の出現にはいくつかの特定の問題があります。具体的には、\1、\2 など、正規表現で一致する最初と 2 番目のパターンを出力するためにバックスラッシュをエスケープする方法がわかりません。
r - rでの正規表現の誤解
gsub や stringr を理解していないようです。例:
わかった。しかし:
私は期待したい
"一冊の本"
ピリオドをスペースに置き換えています。
また: srintr
:str_replace(a, ".", " ")
戻り値:
" .book"
そしてstr_replace_all(a, ".", " ")
戻る
" "
私は使用することができますstringi
::stri_replace(a, " ", fixed=".")
"a book"
なぜ gsub (および str_replace) が期待どおりに動作しないのか疑問に思っています。スペースを別の文字に置き換える場合は機能しますが、その逆は機能しません。
r - 正規表現の辞書で TermDocumentMatrix をフィルタリングする
これはかなり簡単なはずだと思います。現在、正規表現に変換したグロブ形式の用語の辞書があります。それらを正規表現に変換した理由は、tm パッケージがそれらでしか機能しないと思うからです。それはいいです。しかし、複数の辞書用語を渡して termDocumentMatrix をサブセット化する方法がわかりません。これに対するもう 1 つのひねりは、辞書の用語には複数の長さがあるということです。1 語、2 語、3 語の長さがあります。
以下は私の現在のコードです。
r - RでアクセントをASCIIに変換する
Rで特殊文字をASCIIに変換しようとしています。この質問でハドリーのアドバイスを使用してみました:
しかし、私は "Jos�" を取得します。stringi v1.1.1 を使用しています。
私はMacを実行しています。Windows マシンを実行している私の友人は、"Jose" の望ましい結果を得ているようです。
何が起こっているのですか?
regex - R の文字列 - 選択したアルファベット文字と数字の間にスペースを挿入する
一貫性が必要な病棟データがあります。最初の数字はフロア番号、それに続くアルファベットは病棟の頭字語、最後の 2 文字の数字はベッド番号です。
したがって、2EA 28 は 2 階、病棟東、ベッド 28 になります。
場所は、次のように一貫性のないスペースで入力されています。
私はそれが次のように見えることを望みます
先頭に数値がない場合は、数値と文字を一度に 1 つずつサブアウトしますが、数値であるため、文字数値が問題を引き起こしています。1462 行あります。
さらに複雑なことに、ICU などの 1 階の病棟には先行番号がありません。
リクエストに応じて追加 - 人間が読める名前
人間が読める名前: