問題タブ [duke]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1719 参照

java - Duke Fast Deduplication: java.lang.UnsupportedOperationException: 操作はまだサポートされていませんか?

Duke Fast Deduplication Engineを使用して、勤務先の会社のデータベースで重複レコードを検索しようとしています。

次のようにコマンドラインから実行します。

しかし、私はエラーが発生します:

私の構成ファイルは次のようになります。

何がサポートされていないのかはわかりません...試しているだけで、構成に関してはまだ深刻なことは何もありません。

0 投票する
3 に答える
660 参照

java - デューク - org.apache.lucene.analysis.standard.StandardAnalyzer

https://github.com/larsga/Duke - データ重複除去のために Duke を使用しています。

Duke をセットアップしました (jar ファイル - Duke jar と lucene jar がクラスパスに追加されます) ..

github のサンプル例 - https://github.com/larsga/Duke/wiki/SemanticDogfood

一方、同じ github の他の例は機能します - https://github.com/larsga/Duke/wiki/LinkingCountries

誰でも助けてくれますか..よろしくお願いします..

0 投票する
0 に答える
121 参照

java - Duke 重複排除エンジン: 正確なレコードが見つかりません

Duke がレコード リストで完全に一致するものを見つけるための構成とプロセッサを作成しようとしています。ExactMatchComparator ベースのプロセッサを作成しましたが、関数が正確な一致を返しません。プロセッサ、構成、およびリスナーのセットアップは次のとおりです。

テストする関数は次のとおりです。

私はAPIを使用しており、ここで言及されているSOに関する質問を読みましたが、Javaでテストを行っている間、その質問はXMLを参照しています。

getMatches を空にしないでください。見つかった重複のリスト、またはその逆 (重複のない一意のレコードのリスト) を取得するにはどうすればよいですか? ありがとう

0 投票する
0 に答える
72 参照

xml - Duke Record リンケージ構成 XML

このレコードのリンケージに問題があります。この 2 つの csv ファイルと完全なマッピングがあります。この構成を使用しましたが、Duke は常に 0 リンクが見つかりました。おそらく、間違ったしきい値を選択したのでしょうか? 誰かが私を助けることができますか?

https://www.dropbox.com/s/m80eub51ng7iz5o/help.zip?dl=0