問題タブ [textmatching]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
215 参照

java - Can I set array in class from inside action listener? JAVA

Basically all I need to do is get array1 and array2 from each of my buttonlisteners and I have no clue how to do this as it is.. Right now the TextMatch button doesn't work because array1 and array2 are empty, is there a way to set them from the buttonlistener classes? All I need is a way to set array1 and array2 as ss and sstwo so I can implement my TextTools.match() method

MAIN PROGRAM:

TEXT MATCH PROGRAM:

0 投票する
1 に答える
1150 参照

tf-idf - 2 つのテキスト ドキュメントを一致させる最良の方法

私は2つのテキストドキュメントをインテリジェントに作成するようなソフトウェアを作成しようとしています.DIFFのようではなく、テキストがどれだけ一致するかをチェックするようなものです。

しかし、私はそれらの両方の間で混乱しています。どちらが優れているのかわかりません。また、テキストドキュメントを一致させる他の手法はありますか?

0 投票する
4 に答える
2688 参照

solr - スペース、ハイフン、大文字と小文字、および句読点のさまざまな組み合わせによる検索

私のスキーマ:

やりたい組み合わせ:

「ウォルマート」、「ウォルマート」、「ウォルマート」、「ウォルマート」、「ウォルマート」

これらの文字列のいずれかが与えられた場合、もう一方の文字列を見つけたいと思います。

したがって、以下に示すように 25 の組み合わせがあります。

(最初の列は検索用の入力テキストを示し、2 番目の列は予想される一致を示します)

私のスキーマの現在の制限:

アナライザーのスクリーンショット:

初期スキーマを使用したアナライザーのスクリーンショット

これらの制限を解決するために、さまざまなフィルターの組み合わせを試しましたが、Solr - 大文字と小文字を区別しない検索が機能しないソリューションにつまずきました。

私が持っている制限の 1 つを克服しているように見えますが (#5 ウォルマート -> ウォルマートを参照)、以前の制限よりも全体的に悪いです。現在、次のような場合には機能しません。

スキーマ変更後のアナライザー: ここに画像の説明を入力

質問:

  1. 「WalMart」が「Walmart」と初期スキーマと一致しないのはなぜですか? walSolr アナライザーは、インデックス時間中martに3 つのトークンを生成したことを明確に示していますwalmart。クエリ時間中: 1 つのトークンが生成されました: (トークンが 1 つしか生成されない理由は明らかではありませんが) 、クエリ トークンとインデックス トークンの両方に含まれるトークンがwalmart一致しない理由がわかりません。walmart

  2. ここで言及した問題は、1 つのユース ケースにすぎません。次のような少し複雑なものがあります。

    アポストロフィー付きの単語: 「マクドナルド」、「マクドナルド」、「マクドナルド」、「マクドナルド」、「マクドナルド」、「マクドナルド」

    句読点が異なる単語: 「マクドナルド エンジニアリング カンパニー」

一般に、この種の要件でスキーマをモデル化するための最良の方法は何ですか? Nグラム?異なるフィールド (異なる形式) で同じデータにインデックスを付け、copyField ディレクティブ ( https://wiki.apache.org/solr/SchemaXml#Indexing_same_data_in_multiple_fields ) を使用しますか? これのパフォーマンスへの影響は何ですか?

編集: 私の Solr スキーマのデフォルトの演算子は AND です。ORに変更できません。

0 投票する
1 に答える
534 参照

nlp - 名前は異なるが意味的には本質的に同じ会社をグループ化するにはどうすればよいですか?

私は、英国の公共部門からのオープン ガバメント データを使用して競合他社の分析を行っています。しかし、私の結果にはいくつかの異常があります。契約を会社名でグループ化すると、会社のスペルが間違っていたり、名前が異なっていたりするなど、多くの問題があります。たとえば、HP、Hewlett-Packard、Hewlett-Packard Limited、ibm、ibm UK、ibm UK limited などです。問題は、既にコードを実行し、結果を手動で修正したことです。コードの一部を変更したので、再度実行する必要があります。しかし、コストがかかるため、同じことをやり直すことはできません。現時点では、これらの会社をアルファベット順に並べ替え、最初の数単語が一致したときに統合する一般的なルールを作成することを考えています。ただし、HP と Hewlett-Packard は異なるため、完全に証明されたアプローチではありません。誰かが以前に同様の種類の仕事をしたことがありますか、または私に彼らの仕事を紹介してください。私は感謝されます。ありがとう。

0 投票する
2 に答える
847 参照

javascript - Javascript/Jquery: 検索を含むラベル テキストを警告するにはどうすればよいですか?

こんにちは、私はこれに大まかに基づいてさまざまなものを検索して見つけましたが、いくつかはより密接に関連していますが、私が抱えている問題に対して実行可能な解決策を考案して作成することはできませんでした:

概要:

私の要件により、特定の方法でビューを作成しようとしています。これは現在、自己実装された Treeview スタイルの使用を検討しています - 現時点では、他のプラグインや事前に作成されたビューを使用したくありません。添付の JS フィドル デモでわかるように、これを自分で達成します。

当面の問題:

これはばかばかしいほど簡単または簡単かもしれません。もしそうなら、私の無能さを許してください。しかし、問題はタグにあります。

今では、この値を取得するのに問題はありません - それらのリストにはかなりの数があります (オプションごとに 1 つ)。しかし、最終的に問題の根底にあるのは、これらを私の検索入力に一致させることです。私は非常に明白で一般的な for each ループを使用しましたが、実際には「入力」(検索入力の変数)とラベルのテキストを一緒に一致させるのに問題があります。したがって、正しい値を警告せず、15 個の値すべてを警告する場合があります。 4つだけが一致する場合...

選択ボックスと一緒に非常にうまく機能するツリービューコードを自由に使用してください。

サイドノート

私の実際の見解では、これらのチェック ボックスは、オブジェクト クラスを使用して値を入力するラベル名に関連付けられます。また、一致するラベルに実際に警告するのではなく、それらを強調表示したいので、誰かがそれを手伝ったり、何か良いことを提案したりできれば、重大な問題ではありません。(申し訳ありませんが、これは役に立たないか役に立たないことはわかっていますが、これらのラベルに警告する理由について説明したいと思います。)

MY JS FIDDLE DEMO - TREEVIEW - EDIT:これは私が必要としていた答えでした(他の誰かがこれを使用したい場合に備えてここに残します)、Radu Andreiから完全に提供された答え


編集:ラベルのテキストが検索テキストと一致するという事実を除いて、基準に基づいて警告するつもりはありません。

0 投票する
5 に答える
8649 参照

sql - 複数の単語を検索するクエリで LIKE を使用する方法は?

私は顧客テーブルを持っています

John Matt文字列なしで与えられる可能性のある顧客を検索したいと思いdeoます。これに LIKE 条件を使用する方法は?

結果は行 1 をフェッチする必要があります。

検索文字列がMatt Deoまたはjohn

正確な名前を見つけようとすると、上記は実装できません。2 つの文字列が指定されている場合でも、LIKE クエリを作成して顧客を取得するにはどうすればよいですか?

0 投票する
5 に答える
2624 参照

python - キーにスペースを使用した Python 辞書の置換

私は文字列と辞書を持っています。そのテキスト内のすべての辞書キーを置き換える必要があります。

キーにスペースがない場合は、テキストを単語に分割し、 dict と 1 つずつ比較します。O(n)かかったように見えます。しかし、今ではキーの中にスペースができているので、物事はより複雑です。これを行う良い方法を教えてください。キーとテキストの大文字と小文字が一致しない場合があることに注意してください。

アップデート

私はこの解決策を考えましたが、効率的ではありません。O(m*n) 以上...