問題タブ [string-matching]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
22 に答える
145754 参照

javascript - IPアドレスを確認するJavaScript正規表現

次のようないくつかの IP アドレスがあります。

  1. 115.42.150.37
  2. 115.42.150.38
  3. 115.42.150.50

3 つの IP アドレスすべてを検索するには、どのような正規表現を記述すればよいですか? たとえば、そうすると115.42.150.*(3つのIPアドレスすべてを検索できるようになります)

私が今できることは、次のようなものです。/[0-9]{1-3}\.[0-9]{1-3}\.[0-9]{1-3}\.[0-9]{1-3}/しかし、うまく機能しないようです。

ありがとう。

0 投票する
3 に答える
11534 参照

iphone - 文字列照合Objective-c

この方法で文字列を一致させる必要があります。*myString* ここで、*は任意の部分文字列を意味します。どの方法を使用すればよいですか?

手伝ってくれませんか。

0 投票する
1 に答える
515 参照

algorithm - フレーズのセットを類似のフレーズのセットに分類する

テキスト形式のトレース情報 (ログ) をログ ファイルに生成するアプリがいくつかあります。トレース情報は、典型的な printf() スタイルです。つまり、似ている (printf の同じフォーマット引数) が、フォーマット文字列がパラメータを持っていた場所が異なる多くのログ エントリがあります。

ログエントリを分析し、それらを複数のビン/コンテナに分類できるアルゴリズム (URL、書籍、記事など) は何でしょうか。各ビンには 1 つの関連付けられた形式があります。
基本的に、私が望むのは、生のログ エントリを (formatA, arg0 ... argN) インスタンスに変換することです。ここで、formatA は多くのログ エントリ間で共有されます。formatA は、エントリを生成するために使用される正確な形式である必要はありません (アルゴリズムが単純になる場合はなおさらです)。

私が見つけた文献や Web 情報のほとんどは、完全一致、部分文字列の最大一致、または k 差 (k は既知/事前に固定) を扱っています。また、(長い) 文字列のペア、または単一のビン出力 (すべての入力の中で 1 つの一致) の一致に焦点を当てています。私の場合は、(十分な) 一致 (通常は不連続な文字列のシーケンス) を表すものを発見し、各入力エントリを発見された一致の 1 つに分類する必要があるため、多少異なります。

最後に、私は完璧なアルゴリズムを探しているのではなく、シンプルで維持しやすいものを探しています。

ありがとう!

0 投票する
1 に答える
3065 参照

https - iptables、-m最近(潜在的に)および-m文字列(確実に)を使用して、HTTPS経由で特定のURLへの接続のみを許可する

たとえば、subdomain.mydomain.comへの接続のみを許可したいとします。私はそれを部分的に機能させていますが、Client Helloが許可されると、クライアントキー交換で奇妙なループに陥ることがあります。ああ、さらに面倒なことに、これは自己署名証明書であり、ページには認証が必要であり、HTTPSは非標準のポートでリッスンしています...したがって、TCP/SSLハンドシェイクのエクスペリエンスは多くのユーザーで大きく異なります。

-mは最近正しいルートですか?文字列が表示されたら完全なTCPストリームを許可するためのより適切な方法はありますか?

これが私がこれまでに持っているものです:

はい、私はnginxの調整でこれを回避しようとしましたが、クライアントのこんにちはの前にnginxが444を返すようにすることはできません。代わりにこれを達成する方法を考えることができれば、私はすべての耳です、エラー、目です。

0 投票する
3 に答える
307 参照

javascript - URL文字列に一致するページ上のすべてのリンクを取得する

私は現在、このコードを(Mootoolsと共に)使用して#subnav、特定のURL文字列を含むdiv内のすべてのアンカーの配列を構築しています。

$('subnav').getElements('a[href*=/'+href+']')

work.aspx?subsection=24&project=1問題は、URLが。のアンカーと一致するものを探している場合ですwork.aspx?subsection=24&project=15

どうすればそれを防ぐことができますか?

0 投票する
2 に答える
744 参照

python - Rubyのdifflib

Ruby上のPythonのdifflibに似たライブラリはありますか?

特に、difflib.get_close_matchesに似たメソッドを持つものが必要です。何かお勧めはありますか?

0 投票する
2 に答える
1396 参照

python - Pythonでのあいまいマッチングアルゴリズムの改善

タスク:2つのテキストファイルを取得し、100%一致と75%一致を出力します。

解決策

問題:これは機能しますが、結果はあまり良くありません。一致の例を次に示します。

大学と大学を一致させる必要があるため、Diffの最小パーセントをあまり上げることができません。また、一部の文字列は「The」で始まり、「The」を除く文字列と一致する必要があるため、最初の単語が一致することを確認することはできません。技術的には75%似ているが、人間とはまったく似ていない試合を投げる方向に誰かが私を向けることができますか?

0 投票する
1 に答える
1482 参照

java - 循環多項式によるn-gramのハッシュ-Javaの実装

Rabin–Karp文字列検索アルゴリズムに関連するいくつかの問題を解決しています。このアルゴリズムでは、ローリングハッシュを単純な検索よりも高速にする必要があります。この記事では、ローリングハッシュを実装する方法について説明します。「ラビン-カープローリングハッシュ」を問題なく実装しましたが、実装の実装はほとんどありませんでしたが、計算の複雑さについても言及されており、循環多項式によるn-gramのハッシュが推奨されています。これは、そのような手法のBuzHash実装にリンクしていますが、その上にn-gramハッシュを構築するためにどのように使用できるのでしょうか。このようなものが欲しい、または

Javaの場合。

文字列検索に関連する問題に遭遇する人(私のように)のために、私が有用だと思った記事がいくつかあります1、2、3

0 投票する
3 に答える
10200 参照

php - PHPでの文字列の類似性:長い文字列のレーベンシュタインのような関数

levenshteinPHP の関数は、最大長が255の文字列で機能します。PHPで文の類似度スコアを計算するための適切な代替手段は何ですか。

基本的に私は文章のデータベースを持っています、そして私はおおよその重複を見つけたいです。 similar_text関数は私に期待される結果を与えていません。以下のような類似の文を検出するための最も簡単な方法は何ですか?