問題タブ [stringdist]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - メモリ不足を回避するためにスパースstringdistmatrixを明示的に構築する方法は?
「データ」ベクトル内のわずかに異なる多数のレストラン名を適切な「一致」ベクトルに一致させます。
パッケージ内のstringdistmatrix
機能stringdist
は優れていますが、数 10k x 10k のメモリが不足し、データが大きくなっています。
試してみるas(stringdistmatrix(data, match),'sparseMatrix')
と結果が期待できますが、メモリが不足しています。したがって、ペアがメモリに収まることを期待して、計算された文字列距離または同様の文字列距離を使用sparseMatrix(i,j,x,dims,dimnames)
して、ペアに明示的にインデックスを付けたいと思います。x
adist()
R
しようとしている:
出力が一致することを期待: