問題タブ [approximate]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
522 参照

integer - StretchDIBitsが部分的に画像が揺れる

DCで画像を描画するためにC++GDI、StretchDIBitsを使用しています。

元の画像が大きいため、高品質が必要です。私はHAFTONEモードを使用して、DCに画像全体を描画する(画像をズームする)のに時間がかかるようです。

そこで、StretchDIBitsを使用して部分的に描画することにしました。しかし、StretchDIBitsには深刻な問題があります。

整数の長方形を整数の領域にのみ描画できます(幅と高さ、およびx、yの左上の点はすべて整数です)

の場合、画像は21*21です。私は今、(5、5、7、7)をDCに(20、20、60、60)で描いています。次に、(21、20、61、60)で描きたいと思っています。元の画像に対応する場所がありません。したがって、DCに近似直線を描くことしかできません。今問題が起こっている、画像が揺れている!

私はその問題に悩まされています。どうすれば揺れを防ぐことができますか?

0 投票する
2 に答える
17578 参照

search - Solrでnグラム近似マッチングを使用するには?

私たちは映画とシリーズのデータ​​ベースを持っています。データはさまざまな信頼性のある多くのソースから取得されているため、エピソードのタイトルでファジー文字列マッチングを実行できるようにしたいと考えています。アプリケーションの検索に Solr を使用していますが、デフォルトのマッチング メカニズムは単語レベルで動作するため、タイトルなどの短い文字列には十分ではありません。

私は過去に n-gram 近似マッチングを使用していましたが、Lucene (および Solr) がすぐに使用できる機能をサポートしていることを知り、とてもうれしく思いました。残念ながら、正しく設定できませんでした。

これには特別なフィールド タイプが必要だと思ったので、次のフィールド タイプを schema.xml に追加しました。

スキーマの適切なフィールドを次のように変更しました。

しかし、これは私が期待したようには機能しません。クエリ分析は正しく見えますが、結果が得られないため、インデックス時に何かが発生したと思われます (つまり、タイトルはトリグラム フィールドではなく、デフォルトの文字列フィールドのようにインデックス化されます)。

私がしようとしているクエリは次のようなものです

(タイプミスが 1 つまたは 2 つある場合)、「Guy Walks into a Psychiatric Office」と一致するはずです。

(クエリが正しいかどうかはよくわかりません。)

また、本当はもっと何かできるようになりたいです。文字列を小文字にし、句読点とスペースをすべて削除し、英語のストップワードを削除してから、文字列をトライグラムに変更したいと思います。ただし、フィルターは文字列がトークン化された後にのみ適用されます...

ご回答ありがとうございます。

0 投票する
1 に答える
391 参照

c - tre ライブラリによる近似一致を使用して複数の正規表現ヒットを検索する

C を使用して、別の親文字列内の部分文字列の一致の場所と数を見つけようとしています。おおよその (ハミング距離) 一致も含める必要があるため、http: //laurikari.net/tre/にある tre ライブラリを使用しています。

サイトのドキュメントの一部を理解するのに苦労しています。おそらく、正規表現の専門用語にあまり慣れていないためです。tre のドキュメントによると、「サブマッチ」に関するより具体的な情報を得ることができます。これらは私が探している一致ですか?

ありがとう!

0 投票する
2 に答える
1839 参照

search - ソートされた整数リストでの近似検索のアルゴリズム

整数の配列を考えてみましょう (ソートされていると仮定します)。指定された整数に最も近い整数の配列インデックスを可能な限り最速の方法で見つけたいと思います。複数の可能性がある場合、アルゴリズムはすべてを識別します。

例: T=(3, 5, 24, 65, 67, 87, 129, 147, 166) を考えます。指定された整数が 144 の場合、コードは 147 を最も近い整数として識別し、配列インデックス 7 を指定する必要があります。そのエントリに対応します。66 の場合、アルゴリズムは 65 と 67 を識別する必要があります。

これを行うための O(1) または少なくとも O(log N) アルゴリズムはありますか? 直接検索アルゴリズム (バイナリ検索、ツリー検索、ハッシングなど) の実装は、完全な一致が必要になるため機能しません。これらを修正して近似検索を処理する方法はありますか?

私はCコードを開発しています。

ありがとう

0 投票する
2 に答える
1071 参照

django - Unicode文字列と同等のASCII文字列のDjango近似マッチング

私は次のモデルとインスタンスを持っています:

今、私はオブジェクトを検索できるようにしたいのですが、ユニコードではなくアスキー文字を使用して、次のようなものを使用します:

データベース内のUnicode文字にASCIIスタンドインを使用して、この種の近似文字列マッチングを行う方法はDjangoにありますか?

これは関連する質問ですが、Appleのコアデータについてです。

0 投票する
2 に答える
5146 参照

java - おおよその文字列マッチング用のサンプル Java コードまたはおおよその文字列マッチング用に拡張された boyer-moore

1.不一致 (誤って演奏された音符)、2.挿入 (追加で演奏された音符)、および 3.削除 (失われた音符) を参照に対して楽曲 (たとえば、テーブルに保存された音符ピッチ [文字列値]) で見つける必要があります。音楽作品。

これは、正確な文字列一致アルゴリズムまたは動的プログラミング/近似文字列一致アルゴリズムによって可能です。ただし、メモの不一致、挿入、削除を識別するため、おおよその文字列一致が問題に適していることに気付きました。または、約をサポートするための Boyer-moore の拡張バージョン。文字列マッチング。

おおよその文字列一致を試すことができるサンプル Java コードへのリンクはありますか? 複雑な説明や方程式を見つけましたが、いくつかのサンプル コードと簡単な説明でうまくいくことを願っています。または、boyer-moore でサンプルの Java コードを見つけることができますか? 文字列一致?ボイヤームーアの概念は理解できますが、約 1000 をサポートするように調整するのに苦労しています。文字列の一致 (つまり、不一致、挿入、削除をサポートするため)。

また、最も効率的なものは約です。文字列マッチング アルゴリズム (正確な文字列マッチング アルゴリズムのボイヤー ムーアのような)?

洞察/提案をいただければ幸いです。よろしくお願いします

0 投票する
2 に答える
1701 参照

java - 点のセットでR2線を近似します

統計分析を使用したアプリケーションに取り組んでいますが、助けが必要です。n点のセットが与えられた場合、それらで線を近似するにはどうすればよいですか。アルゴリズムはあると思いますが、見つかりませんでした。

ありがとう!

0 投票する
2 に答える
844 参照

java - Java用のおおよその正規表現ライブラリ?

近似文字列マッチングのためのコードを書いたところです。JVMで実行されているより成熟した実装に対して、ナイーブなアルゴリズムのベンチマークを行いたいと思います。助言がありますか?

0 投票する
5 に答える
8141 参照

c# - 任意の (メンバーではない) 数値に最も近い配列要素を見つけるにはどうすればよいですか?

一見似たような質問: 「配列内の最も近い数値を見つける」(Java) および「倍精度の配列に最も近い一致を見つける」(実際には地理の問題)。

double の (ソートされた) 配列があります。任意の数値 (配列要素の 1 つと完全に一致する場合と一致しない場合があります) が与えられた場合、最も近い数値のインデックスを返すにはどうすればよいですか?

たとえば、次の配列を使用します。

  • 1.8
  • 2.4
  • 2.7
  • 3.1
  • 4.5

2.5 をクエリすると、2.4 の値に対応する 1 のインデックスが返されます。

配列要素の範囲外にある値を検出するためのボーナス ポイント。たとえば、上記の配列を使用すると、コードは 4.6 が入っているが 5.9 が外れていると判断する場合があります。質問のこの部分を試してみたい場合、詳細はあなたの手にあります。

0 投票する
4 に答える
13432 参照

c# - おおよその文字列一致

私は、この質問が何度も聞かれたことを知っています。どのアルゴリズムが近似文字列マッチングに適しているかについての提案が必要です。

アプリケーションは、特に会社名の照合のみを目的としており、他には何もありません。

最大の課題は、おそらく会社の末尾の部分と短い名前の部分です。例: 1. companyA pty ltd と companyA pty. 株式会社 vs companyA 2. WES Engineering vs WES Engineering (ごく稀に)

レーベンシュタイン編集距離は適切だと思いますか?

私はC#を使用しています

よろしく、マックス