問題タブ [phrases]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
facebook - Facebook API で一般的でないフレーズを検索する
一般的でないフレーズ (URL など) の結果を取得することはできますか?
フレーズをエンコードしようとしました。PHP urlencode() 関数を使用して、「http://www.google.com」を含む投稿を探しました。
ただし、私が得るのは次のとおりです。
regex - 2 つの別々のフレーズに一致する正規表現
Web ページに 2 つのフレーズが同時に表示されるようにする正規表現を探しています。
私がウェブ上で確認する必要がある 2 つのフレーズはCurrent QPS (last 10s, ignored 0)
、Average Latency (last 100 queries)
Web ページは次のようになります (クエリ時間は異なりますが、テキストは変わりません)。
Web サイトの各フレーズを一致させることはできますが、2 つのフレーズを一緒にすることはできません。ツールが 2 つのフレーズの間のコンテンツを無視するようにするにはどうすればよいですか?
PSここではどの言語でもプログラミングしていません。正規表現は、正規表現を受け入れるツールに入れられます。
javascript - 2 つ以上の Javascript 文字列内のフレーズの検出
引用符で囲まずに 2 つの文字列で「フレーズ」を検出する簡単な方法があるかどうか疑問に思っています。例えば:
「ジャック・イン・ザ・ボックスが好き」「ジャック・イン・ザ・ボックスは食べ物がおいしい」
この場合、「jack in the box」が検出されます。これで、最初の文字列全体を潜在的に調べて、それが 2 番目の文字列にあるかどうかを確認できますが、そうではありません...そして、3 単語の一致が見つかるまで、長さを短くして 2 番目の文字列を実行し続けます「ジャック・イン・ザ・ボックス」...しかし、あまり効率的ではありません。
どんな助けでも素晴らしいでしょう - ありがとう!
perl - テキストファイル内の語句検索
「私はテキストを検索しています」のようなフレーズと、単語のリストを含む 1 つのテキスト ファイルが与えられます。
テキストファイルに存在する単語のすべての組み合わせを見つける必要があります。
たとえば、「私は」、「私は」、「私は検索しています」、「私は検索しています」、「検索中」などの出現を検索する必要があります。
私はこれを perl で書くことを好み、より高速に動作する最適なソリューションが必要でした。
テキスト ファイルの例:
html - perl 正規表現との混合結果、html コード内のフレーズのリストの一致
正規表現との混合結果、html コード内のフレーズのリストの一致
この新しい投稿は、複数の単語を含む Perl Regex match lines という別の投稿への返信でしたが、理由は不明ですが、モデレーターによって削除されました。元のスレッドで質問するのは理にかなっているように思えました。それは、そのスレッドの早い段階で提供された解決策を使用しようとする試みと、それに伴う問題に関係しているためです。faqへの一般的な参照がありましたが、これは矛盾を明らかにしていないようで、「質問がある場合は、独自の質問を投稿してください」というメッセージがありました。したがって、この投稿。
LWP::Simple を使用して Web ページを取得し、特定のフレーズを含む行を照合しようとしています。上記のスレッドの回答 #1の正規表現をコピーし、一致させる必要がある単語を置換または追加しましたが、似ているが異なる 2 つの Web ページでさまざまな結果が得られます。
私が使用している正規表現は次のとおりです。
タグで囲まれた一連のブロック内にこれらの単語を含む裸の行がある Web サイト #1 の場合、<pre>..</pre>
予想どおり、これとまったく同じすべての行に一致します。
しかし、単語を囲む厄介な小さなタグがあるWebサイト#2の場合:
それはすべての行に一致します!
タグはこれを行うための「適切な」方法であると確信してい<span>
ますが、これらのタグを回避する方法を知りたいので、両方のサイトで正規表現を1つだけ持つことができます. これを行う簡単な方法はありますか、それともhtmlを解析する方法を学ぶ必要がありますか(私がする必要はありません)?
堅牢なソリューションではなく、迅速なソリューションを探しています。これはおそらく1回限りの取引です。これらの比較的静的なページが変更された場合、それはおそらくマイナーであり、簡単に修正できます。すべての 'anti-regex-for-html' ページを私に紹介しないでください。私はそれらを見てきました。そして、私に HTML::TreeBuilder を使わせないでください。あ、お願いします...
pos-tagger - マレットCRFSimpleTaggerフレーズ/マルチワード
私はマレットの初心者です。マレットシンプルタガー/CRFを使用してフレーズを試しています。マレットサイトでドキュメントを検索し、ユーザーアーカイブも調べましたが、何の役にも立ちませんでした。
簡単なタグ付けのために木槌をトレーニングしてみましたが、それはうまく機能します。私のデータは次のようになります(トレーニング間には異なるセットであることを示す改行があることに注意してください)
サンプルトレーニングデータ:
私が抱えている問題は、都市名が複数の単語である場合です、と言います
上記のトレーニングデータでは、「新規」はストップワードの質問であることに注意してください。
- Simple taggerの場合、上記の表現は問題ありませんか?そうでない場合、どのように私は薬局を表すのですか?
- SimpleTagger/CRFが前の「n」の単語を使用してタグに到達できるようにデータを表現する方法がない場合はどうでしょうか。つまり、私の入力のチャンクのようなもの
php - PHP ののしり言葉をフレーズに置き換える
それで、特定の単語を他の単語に置き換える方法がわかります。私が理解しようとしているのは、単語を取得してフレーズに置き換え、他のすべての入力を削除する方法です。
例えば:
悪い言葉は「犬」
ユーザー入力 -> 「あなたは犬のようなにおいがします。」
「犬」を「虹」などに置き換える代わりに、「あなたはトイレの口です」のようにエコーしたいのです。
これが私がコードのために持っているものです:
このコードでは、「You are like a pottymouth.」というエコーが返されます。
これは再投稿であると確信しており、お詫び申し上げます。私が見つけたものはすべて、文字列全体ではなく、文字列の一部のみを置き換える方法に関するドキュメントです。
java - Solr... 検索語と修正語を一緒に作る方法は?
私はそれらの間で一致させる必要がある2つのリスト(実際にはたくさんあります)を持っています。例えば:
次のようなドキュメントがあります。
- マンチェスター・ユナイテッド
- アーセナル FC
- ウィガン
- ...
2 番目のリストは次のようになります。
- マンチェスター U.
- アーセナル
- ウィガン FC
- ...
したがって、2 番目のリストの各単語が最初のリストに存在するかどうかを照会する必要があります (該当する場合は修正します)。
単語リストが常に変わるため、辞書を使用できません。各リストの単語は複数の単語を持つことができます。
N-gram、スペルチェッカーなどのアプローチを探していました...しかし、これらのアプローチは文字ごとに機能するため(たとえば、最初の「M」、2番目の「Ma」など)混乱しており、何がわからないのですかする、または始める。この問題をどのように解決しますか?よろしく!