問題タブ [duke]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Duke Fast Deduplication: java.lang.UnsupportedOperationException: 操作はまだサポートされていませんか?
Duke Fast Deduplication Engineを使用して、勤務先の会社のデータベースで重複レコードを検索しようとしています。
次のようにコマンドラインから実行します。
しかし、私はエラーが発生します:
私の構成ファイルは次のようになります。
何がサポートされていないのかはわかりません...試しているだけで、構成に関してはまだ深刻なことは何もありません。
java - デューク - org.apache.lucene.analysis.standard.StandardAnalyzer
https://github.com/larsga/Duke - データ重複除去のために Duke を使用しています。
Duke をセットアップしました (jar ファイル - Duke jar と lucene jar がクラスパスに追加されます) ..
github のサンプル例 - https://github.com/larsga/Duke/wiki/SemanticDogfood
一方、同じ github の他の例は機能します - https://github.com/larsga/Duke/wiki/LinkingCountries
誰でも助けてくれますか..よろしくお願いします..
java - Duke 重複排除エンジン: 正確なレコードが見つかりません
Duke がレコード リストで完全に一致するものを見つけるための構成とプロセッサを作成しようとしています。ExactMatchComparator ベースのプロセッサを作成しましたが、関数が正確な一致を返しません。プロセッサ、構成、およびリスナーのセットアップは次のとおりです。
テストする関数は次のとおりです。
私はAPIを使用しており、ここで言及されているSOに関する質問を読みましたが、Javaでテストを行っている間、その質問はXMLを参照しています。
getMatches を空にしないでください。見つかった重複のリスト、またはその逆 (重複のない一意のレコードのリスト) を取得するにはどうすればよいですか? ありがとう
xml - Duke Record リンケージ構成 XML
このレコードのリンケージに問題があります。この 2 つの csv ファイルと完全なマッピングがあります。この構成を使用しましたが、Duke は常に 0 リンクが見つかりました。おそらく、間違ったしきい値を選択したのでしょうか? 誰かが私を助けることができますか?