問題タブ [word-boundaries]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
275 参照

javascript - 単語アトム「\<」と「\>」のVim正規表現の開始と終了に相当するJavaScriptはありますか?

\bJavaScriptの正規表現エンジンを含め、ほとんどの正規表現エンジンは、単語の先頭でも末尾でも、単語の境界と一致する必要があることを知っています。

しかし、Vimにはさらに2つの特定の正規表現アトムがあります。

JavaScriptにはこれらのアトムと同等のものがありますか?そうでない場合は、より正確なセマンティクスを他の方法で表現する方法はありますか?

0 投票する
1 に答える
229 参照

mysql - [[:<:]][[:>:]]を使用する場合、スペースは単語境界と見なされますか?

検索語に一致する非常に単純な検索クエリを作成しようとしていますが、完全な単語に一致するため、部分一致は問題外です。

検索する文字列は次のとおりです。

一致するクエリは次のようになります。

などですが、そうではありません:

これらは部分一致のみであるためです。ここでは LIKE は役に立たないので、REGEXP と単語境界を試しています。

問題は、pt.2 の境界がスペースをカバーしていないのに、pt.3 のように見えるのはなぜですか? ここで何が欠けていますか?

ありがとう

0 投票する
2 に答える
80 参照

c - C構造のアラインメント

ファイルにいくつかのバイナリ データがあり、そのファイルを のメモリにロードしますchar* data。これで、たとえば、オフセット 123 で が始まることがわかりましたstruct something

次のことをしても安全ですか

次に、構造体のメンバーにアクセスします。または、次のようなことをする必要があります

それともまったく違うものですか?

「メモリの配置」、「単語の境界」などについて曖昧な記憶があるため、私の質問は主に動機付けられています...

0 投票する
3 に答える
469 参照

regex - 正規表現による WORD パターンのマッチング

大きな段落があり、その中に次のような単語があるとしますfound field failed fired killed(私が知っている否定的な単語がたくさんあります!! )

ここで、 orで始まりorで終わる単語を 含む行を取得したいfi hik elded

文字列内の単語のこのパターンを検索するにはどうすればよいでしょうか....??

文字列パターンではなく、文字列内の単語パターンについて質問していることを確認してください

これらの2つは確かに機能しませんでした

私はregex基本的な理解からそれを行っているので、より良い方法を提案してくれる人は誰でも(いくつかの説明とともに)大歓迎です!! :)

0 投票する
2 に答える
2242 参照

regex - 単語境界または非数字での正規表現一致

正規表現パターン (Java) を使用して、3 桁のシーケンスと 3 桁のみが連続するものを見つけようとしています。4 桁が一致しません、2 桁が一致しません。

私にとって明らかなパターンは次のとおりです。

これは、次のような多くのソース文字列のケースと一致します。

ただし、c/1 境界と 3/d 境界は、\b クラスが期待する「単語境界」の一致としてカウントされないため、「abc123def」のソース文字列とは一致しません。

解決策として、非数字 (\D) と単語境界 (\b) の両方を含む文字クラスを追加することを期待していました。しかし、それは違法な構文のようです。

次のようなソース文字列の状況で「123」を抽出する式として何を使用できるか知っている人はいますか?

助けていただければ幸いです。はい、Java では \b のようなコードを \b にダブルエスケープする必要があることは理解していますが、それは私の問題ではなく、これを Java 関係者に限定したくありませんでした。

0 投票する
1 に答える
391 参照

php - 正規表現を使用して単語の接辞を無視しながら単語全体を一致させる

私は新しい言語を学んでおり、約でDBを作成しました。2500 の単語と 2500 の単語の例。基本的に各単語の写真を表示するPHP / MySQL Web UIを作成し、それらをクリックすると単語の音声が再生されます。単語が出現するすべての例に一致して表示するポップアップ div をトリガーするコンテキスト メニューもあります。

私は REGEXP を使用しています'[[:<:]]$word[[:>:]]'が、除外したい単語の接頭辞/接尾辞がいくつかあり、単語に実際の意味を追加しません (英語の接尾辞 -ing など)。私がこれを回避した1つの方法は、接辞が始まる単語にハイフンを入れて、正規表現が単語と一致するようにすることですが、これは言語がスペルを処理する方法に完全には当てはまりません. 意味がまったく異なるため、フィルタリングしたくない単語のさまざまな組み合わせもあります。詳細に入ることなく、一致した単語が単に「WORD」であり、接頭辞と接尾辞がpre1, pre2... およびsuf1, ... としてsuf2フィルタリングしたいものと、フィルタリングしたくないものを含むいくつかの疑似例を次に示します。xxx

上記の例では、1、2、3、4、5 に一致させたいのですが、6、7、8、9、10 には一致させたくありません。たとえば、OR 句を追加し始めました。

これは 1 つの例外では問題なく機能しますが、複数の例外では面倒になります。

確かに、私は正規表現にかなりの経験がありません. これは短く効率的な正規表現で行うことができますか?

0 投票する
4 に答える
1941 参照

c# - 配列C#を使用したスト​​ップワードの削除

私はストップワードの文字列配列と入力テキストの文字列配列を持っています

ここで、これらの stopWords 配列を使用して、input_Texts 配列から削除する必要があります。私は次の手法を使用しましたが、両方の配列インデックスにアクセスしている間、奇妙に機能しませんでした。たとえば、input_Texts 配列のインデックス 0 にある最初のテキストを取得します。

そして、stopWords 配列のすべての単語文字列に一致します。

次に、配列stopWordsのインデックス 0 テキストからすべてを削除した後input_Texts、input_Texts 配列内のすべてのテキストに対してそれを繰り返す必要があります。

変更を加えた提案やコード サンプルは、謝辞とともに高く評価されます。

ありがとう。