問題タブ [agrep]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 1 つの列内のファジー マッチング文字列と可能な一致のドキュメント化
ジャーナル/研究論文のタイトルを含む〜5,000行の比較的大きなデータセットがあります。データセットの小さなサンプルを次に示します。
そこにはタイトルの重複がいくつかあることがわかりますが、フォーマット/大文字と小文字が異なります。重複しているタイトルを特定し、どの行が一致する可能性があるかを記録する新しい変数を作成したいと考えています。これを行うために、ここで提案されているように agrep 関数を使用しようとしました:
これにより一致が識別されますが、結果は新しい変数列にリストとして保存されます。agrep の結果がリストとして保存されず、どの行が一致するかを識別するだけ (例: 6:7) の場合、これを行う方法はありますか (base r または data.table を使用するのが望ましい)。
事前に感謝します-十分な情報を提供したことを願っています.
r - Rでのagrepファジーマッチングの制約を理解する
agrep
これは非常に単純に思えますが、何らかの理由で、置換を含むあいまい一致の動作がわかりません。2 つの置換は、 が指定されている場合all=2
は期待どおりに一致しますが、 が指定されている場合は一致しませんsubstitutions=2
。どうしてこれなの?
reprex パッケージ(v2.0.0)により 2021-06-03 に作成