問題タブ [grepl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
316 参照

r - grep でドットを含む名前を見つけるのが難しい

grep でドットが含まれる名前を見つけるのに苦労しています。それらを見つけることができません。私は、非ドット名に問題はありません。「JD Drew」などの名前を意味します。次のコードを試しました。

前もって感謝します

0 投票する
2 に答える
1784 参照

regex - 複数の一致パターンを使用した文字列列のタグ付け/分類

ある列にカテゴリラベルがあり、別の列に一致する用語/パターンがある別のデータフレームに基づいて分類する必要がある文字列の列を持つデータフレームがあります。

50 以上のカテゴリがあり、各文字列は複数のカテゴリに一致する可能性がありますが、他のカテゴリには一致しません。これらの文字列にカテゴリ ラベルを効率的にタグ付けするにはどうすればよいですか?

以下は、簡単なサンプル データセットと、取得したい出力です。違いがあるとすれば、実際のデータ セット内の文字列はこれらのサンプル文字列よりもはるかに長く、その数は数十万になります。

これは私が得たいと思っている出力です:

grepl と for ループまたは apply のバージョンの組み合わせが必要だと思いますが、以下で試した例では、R をほとんど理解していないことがよくわかります。たとえば、sapply を使用すると期待どおりの結果が得られますが、よくわかりsapply(category_df$items, grepl, recipes_df$recipes)ませんこれらの結果を必要な単純な列に変換する方法。

ここにある categorize 関数を使用すると、各文字列に対して 1 つのカテゴリのみが一致します。

同様に、ここで見つかった関数は私が探しているものに最も近いものですが、カテゴリ番号がそのようにマッピングされる理由がわかりません. 野菜のカテゴリは 2 ではなく 1、乳製品は 3 ではなく 5 になると思います。

0 投票する
1 に答える
119 参照

r - Rでgreplを使用して、共著者のリストから家族と名を一致させます

grepl() を使用して R の bibTEX ファイルから一意の作成者を一致させようとしていますが、'given' 名と 'family' 名の両方を一致させるのに問題があります (どちらか一方だけではなく.Family name のみ問題はありませんが、私の参考文献には同じ姓の著者が複数います。

私の入力ファイル(例)はdat.bibです:

そして今、私がRで試したこと

与えます:

「著者」の結果だけを使用することはできません。共著者分析を試みているためです。複数の論文で共著している場合、同じ著者が別の結果として返されます。

ユニークな著者を照合してみました:

どちらが返されますか:

戻り値:

しかし、私が欲しいのは、ユニークな作家が戻ってくることです

「家族」と「与えられた引数を一緒にバインドしようとしました

警告メッセージが表示されます:

パラメータ引数を一緒にバインドする方法、または bibtex ファイルで「家族」と「与えられた」をバインドする方法はありますか?

私はまだ初心者です。どんな助けでも大歓迎です!

0 投票する
1 に答える
160 参照

r - 複数のテキストにgreplを使用する

次の変数があると仮定します。

そして、次の結果を持つ新しい変数が必要です。

私がやろうとしているのは、たとえばoneorという単語onがテキストに含まれているかどうかを確認oneし、新しい変数に新しい値を割り当てることですdaまた、階層に複数の値がある場合は、最後の値から取得する必要があります。

私にできることは次のとおりです。

単純なループでも同じことができます。しかし、他にもっとエレガントな方法はありますか?

0 投票する
1 に答える
55 参照

r - grepl を使用して変数に名前を付ける

次のデータフレームがあります

ここで、説明の単語に基づいて行への投稿を指定する、ちょっとしたテキストマイニングを行いたいと思います。したがって、「bankafschrift」を含む説明を「銀行」として宣言したいと思います。次のように真/偽の値を取得する方法を知っています:

それは私に与えます:

しかし、grepl ステートメントが true の場合に備えて、投稿に「食料品」と言ってもらいたいです。これを行う方法について何か提案はありますか?

そしてこれに加えて:

投稿を決定するための項目を増やしたい場合、リストをどのように使用しますか?

これを行う場合:

次のエラーが表示されます。

0 投票する
0 に答える
39 参照

r - R でのデータ JSON 形式ファイルの取得

次の形式の JSON ファイルを R にインポートしました。

そして、テキスト変数を持つ別の data.frame があります。

したがって、私が望むのは、この都市が存在するかどうかを JSON ファイルで確認し、次のように国を新しい変数に割り当てることです。

私は使用することを考えていました: unlist()JSON ファイル ->grepl値に都市があるかどうかを調べるために使用します。他のアイデアはありますか?

0 投票する
1 に答える
335 参照

regex - grepl() と lapply で欠損値を埋める

例として次のデータがあります。

「名前」、「国」、および「タイプ」の値を持たない「フル」(名前) 列の他の項目を R が見て、それらが他の項目と一致するかどうかを確認できるようにしたいと思います。たとえば、full の 4 行目に「bombay US mango」が含まれている場合、国は US と読む必要があり、bombay はタイプの下にあり、mango は名前の下にある必要があることを識別できます。

これは私がこれまでに持っているもので、アイテムが一致する場所を(論理的に)特定するだけです:

私は少し立ち往生しています..私は多くの正規表現の投稿とrヘルプガイドを読みましたgreplが、優れた解決策を見つけることができません. 私が持っているものは、論理的な「一致」ベクトルを完全に識別していないため、if ステートメントをサブセット化して使用して異なる要素を連結することはできません。理想的には、私の fruit.region は実際にはデータ テーブルにあるため、これらの要素を data.table 形式で置き換えられるようにしたいと考えています。誰かが最善のアプローチについて何か提案はありますか?