“qdap”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1486 参照

r - RでZipfの法則をプロットできません

テキストファイルから読み込まれた用語とその頻度の大きなリストがあり、それを表に変換しました。

おそらく、単語ランクの列を追加してから、頻度に対してランクをプロットする必要がありますが、どうすればよいですか?

r distribution tm qdap

2015-02-07T09:25:54.103

0 投票する

2 に答える

2298 参照

r - パターンのベクトルと置換のベクトルを与える R の文字列を置換します

置き換えたいさまざまなプレースホルダーを持つ文字列が与えられた場合、R には、パターンのベクトルと置換のベクトルが与えられた場合にそれらすべてを置き換える関数がありますか?

リストとループでそれを達成することができました

同様の質問R: gsub, pattern = vector および replacement = vectorがありますが、異なる文字列をそれぞれ 1 つのパターンのみに置き換えることを求めています。ここでは、すべてのパターンを単一の文字列に置き換えることを探しています。

私が試してみました

明らかに、出力は私が望むものではありません (複数の出力文字列、それぞれに 1 つの置換しかありません)。

関数がベースに存在するか、前に示したように呼び出され、単一の文字列ですべての置換を実行できる既知の CRAN パッケージに存在するかどうか疑問に思っていました。

誰かが私のループに対してより良い解決策や推奨事項を持っていますか、それとも関数に変換する必要がありますか?.

[注意] 文字列は、小さな Web ページテンプレート、または構成ファイルである可能性があります。それらは小さいので、10 または 20 の置換のループを作成することは大したことではありませんが、より洗練されたソリューションを探しています。

r stringr qdap

2015-02-15T18:52:43.770

0 投票する

1 に答える

1274 参照

r - R qdap::mgsub、正規表現でパターンを渡す方法は?

前の質問 (パターンのベクトルと置換のベクトルを与える R の文字列を置換する) で、y は mgsub がエスケープする必要のない文字列をパターンとして持っていることを発見しました。これは、'[%.+%]' のようなテキストをリテラル文字列として置き換えたい場合には適していますが、次のような実際の正規表現を渡す必要がある場合には良くありません。

mgsub に正規表現を渡すにはどうすればよいですか?

[更新] @BondeDust は正しいです。この過度に単純化された例では、質問は意味がありません。mgsub を使用する理由は、パターンのベクトルと置換のベクトルを単一の文字列で使用し、この文字列ですべての置換を行う機能のためです。

たとえば、次の例では

可能な場合は正規表現を使用し、可能なすべての文字列を記述したくありません (事前にわからない場合もあります)。

r qdap

2015-02-15T22:49:08.483

0 投票する

0 に答える

1073 参照

r - qdap を実行するには、gtools を依存関係 = T で繰り返しインストールする必要があるのはなぜですか?

パッケージqdap[2.2.0] とgtools[Ver. 3.4.1] がqdap必要です。しかしlibrary()、引数を使用して毎回 gtools を再インストールするまで、それらのロードは失敗しますdependencies = TRUE。私は何を間違っていて理解していませんか？

r installation qdap

2015-02-28T12:45:14.603

0 投票する

1 に答える

1307 参照

r - R-品詞のタグ付けで pos() 関数がどのように機能するか

私はRが初めてで、pos()関数の仕組みに混乱しています。理由は次のとおりです。

例：

これにより、単語数を示す正しい出力が生成されます

一方、次の操作はエラーをスローします。

なぜこれが引き起こされるのか理解できません。

r string tagging qdap

2015-04-27T12:57:36.203

0 投票する

2 に答える

3167 参照

r - 文字ベクトルからの一般的な単語ペアの抽出とカウント

文字ベクトル内の隣接する単語の頻繁なペアを見つけるにはどうすればよいでしょうか? たとえば、原油データセットを使用すると、「原油」、「石油市場」、「百万バレル」などの一般的なペアがいくつかあります。

以下の小さな例のコードは、頻繁に使用される用語を特定しようとし、肯定的な先読みアサーションを使用して、それらの頻繁に使用される用語の直後に頻繁に使用される用語が何回続くかを数えます。しかし、その試みは墜落し、燃えました。

最初の列 (「ペア」) に共通のペアを表示し、2 番目の列 (「カウント」) にそれらがテキストに出現した回数を示すデータフレームを作成する方法について、ガイダンスをいただければ幸いです。

ここで努力が挫折します。

Java や Python を知らなかったので、これらはJava が単語のペアを数えるのに役立ちませんでした。

ありがとうございました。

r regex-lookarounds tm qdap

2015-06-14T14:39:17.030

0 投票する

1 に答える

1027 参照

r - Rでのagrep文字列マッチング

いくつかの製品名のリストが 2 つあります。私の問題は、「オペレーティングシステム」が「システム」、「冷却システム」などと一致していることです。ただし、"Operating"、"OS" とのみ一致する必要があります。別の例として、「Key Board」は「key」または「KB」と一致させる必要がありますが、「Mother Board」または単に「Board」とは一致させないでください。

2 番目の単語よりも最初の単語を重視するにはどうすればよいですか?

私agrep()はRで使用しました。最初の例でも「システム」と「冷却システム」に一致します。その一致を回避する方法は？

また、「キーボード」を「KB」に、「オペレーティングシステム」を「OS」に対応させる機能・方法はありますか？

前もって感謝します。

r string-matching tm agrep qdap

2015-06-23T08:33:04.400

問題タブ [qdap]

Reference