問題タブ [agrep]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

90 問題

0 投票する

2 に答える

230 参照

r - 1 つの列内のファジーマッチング文字列と可能な一致のドキュメント化

ジャーナル/研究論文のタイトルを含む〜5,000行の比較的大きなデータセットがあります。データセットの小さなサンプルを次に示します。

そこにはタイトルの重複がいくつかあることがわかりますが、フォーマット/大文字と小文字が異なります。重複しているタイトルを特定し、どの行が一致する可能性があるかを記録する新しい変数を作成したいと考えています。これを行うために、ここで提案されているように agrep 関数を使用しようとしました:

これにより一致が識別されますが、結果は新しい変数列にリストとして保存されます。agrep の結果がリストとして保存されず、どの行が一致するかを識別するだけ (例: 6:7) の場合、これを行う方法はありますか (base r または data.table を使用するのが望ましい)。

事前に感謝します-十分な情報を提供したことを願っています.

2021-03-23T01:39:20.927

0 投票する

1 に答える

79 参照

r - Rでのagrepファジーマッチングの制約を理解する

agrepこれは非常に単純に思えますが、何らかの理由で、置換を含むあいまい一致の動作がわかりません。2 つの置換は、が指定されている場合all=2は期待どおりに一致しますが、が指定されている場合は一致しませんsubstitutions=2。どうしてこれなの？

^{reprex パッケージ(v2.0.0)により 2021-06-03 に作成}

r fuzzy-search agrep

2021-06-03T20:52:34.303

1 2 3 4 5 6 7 8 9 10

問題タブ [agrep]

r - 1 つの列内のファジー マッチング文字列と可能な一致のドキュメント化

r - Rでのagrepファジーマッチングの制約を理解する

Reference

r - 1 つの列内のファジーマッチング文字列と可能な一致のドキュメント化