問題タブ [word-boundary]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - C# 正規表現で \b を使用しても機能しませんか?
次の正規表現が一致しないのはなぜだろうか。
から単語境界文字 (\b) を削除すると、pattern
うまく一致することに注意してください。これをつまずかせている可能性のある '\b' について何かありますか?
javascript - JavaScript 正規表現と境界
同僚から正規表現の問題について尋ねられましたが、見つけて答えられないようです。
テキスト エディターで特定の長さのテキストを強調表示するために境界を使用していますが、問題を示すサンプル コードを次に示します。
問題は、最初のリテラル str.replace は機能しますが、RegExp オプションは機能しません。
IE と FF で同じ動作をしていますが、その理由を知っている人はいますか?
java - Java 正規表現の単語境界内で先頭または末尾のドル記号 ($) を引用できるようにする必要がありますか?
Java (1.6.20) で一致する先頭/末尾の $ を持つ正規表現を取得するのに問題があります。
このコードから:
次の結果が得られます。
最初の 2 つのブロックの先頭の false が問題のようです。つまり、先頭/末尾の $ (ドル記号) は、\b (単語境界) マーカーのコンテキストで適切に取得されません。
\b を .* に置き換えるか、すべて一緒に削除すると、目的の結果が得られるため、ブロック内の真の結果は、引用符で囲まれたドル記号自体ではないことを示しています。
最後の 2 つの「真」の結果は、問題が内部的に引用された $ にも、引用された式「\Q ... \E」内の単語境界 (\b) の一致にもないことを示しています。
これは Java のバグですか、それとも何か不足していますか?
regex - 単語境界での Perl 正規表現の置換。「/」を単語境界として検出する
奇妙な正規表現の問題が発生しています....置換を行っているドキュメントがあります...例として、「DEXX」を「DEXX/AREX」に置き換えてから、次の置換で置き換えたい.. . 「AREX」と「AREX/CUBE」
DEXX と AREX は次のようにハッシュに格納されます.... "DEXX" => "AREX", "AREX" => "CUBE"
私が持っている正規表現はこれです.....
何が起こっているかというと、「DEXX」が「DEXX/AREX」に置き換えられているということですが、「DEXX/AREX」が検出されると、正規表現は「DEXX/AREX」を「DEXX/AREX/CUBE」に置き換えます。 「DEXX/AREX」のような別の組み合わせの一部としてではなく、独立した単語として検出された場合は「AREX」
「/」を単語境界として検出するようです。誰かがこれに遭遇したか、それに関する修正を知っていますか? どうもありがとう!エイミー
php - PHPの非ラテン文字の単語境界
この例は正常に動作します:
「u」修飾子を使用しても、これはロシア語の文字が使用されていても機能しません。
それで問題は、これを修正するにはどうすればよいですか?
ありがとう。
java - テキストからの単語境界の検出
単語境界の識別でこの問題が発生しています。ウィキペディアドキュメントのすべてのマークアップを削除しました。次に、エンティティのリストを取得したいと思います(意味のある用語)。文書のバイグラム、トリグラムを取り、辞書(wordnet)に存在するかどうかを確認する予定です。これを達成するためのより良い方法はありますか?
以下はサンプルテキストです。エンティティを識別したい(二重引用符で囲まれているように表示)
Vulcans are a humanoid species in the fictional "Star Trek" universe who evolved on the planet Vulcan and are noted for their attempt to live by reason and logic with no interference from
emotion They were the first extraterrestrial species officially to make first contact with Humans and later became one of the founding members of the "United Federation of Planets"
javascript - アクセント付き文字を考慮した正規表現を作成するにはどうすればよいですか?
基本的に2文字の単語を見つけるJavaScript正規表現があります。問題は、アクセント付きの文字を単語の境界として解釈することです。確かに、そのようです
単語境界 ("\b") は、片側に "\w" があり、反対側に "\W" がある 2 つの文字の間のスポットです (どちらの順序でも)。 "\W" に一致する文字列の先頭と末尾。 AS3 RegExp は、境界型の文字を含む単語に一致します
それ以来
\w は、アンダースコア ([a-zA-Z0-9_] の略) を含む任意の英数字 (単語文字) と一致します。\W は、単語以外の任意の文字に一致します ([^a-zA-Z0-9_] の略) http://www.javascriptkit.com/javatutors/redev2.shtml
明らかにアクセントのある文字は考慮されません。のような言葉で問題になりますMontréal
。é
が単語境界と見なされる場合、はal
2 文字の単語です。アクセント付き文字を許可する単語境界の独自の定義を作成しようとしましたが、単語境界は文字でさえないため、それを見つける方法が正確にはわかりません..
何か助けはありますか?
以下は、正規表現userInput
を使用して 2 文字の単語を検索して見つける、関連する JavaScript コードです。re_state
regex - PostgreSQL 正規表現の単語境界?
PostgreSQL はサポートしています\b
か?
私は試し\bAB\b
ていますが、何にも一致しませんが、一致(\W|^)AB(\W|$)
します。この 2 つの表現は本質的に同じですよね。
javascript - jQuery(Javascript)で段落内の「単語」インデックスを見つける
テキストの段落を表す文字列があります。
この段落で「単語」のインデックスを検索し、「単語」と完全に一致させたいと考えています。たとえば、「古い」を検索する場合。「コールド」の「古い」の一致は無効であるため、2 つではなく 1 つの結果しか取得できません。