問題タブ [phrase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 最初の単語を無視したSolr検索
私はSOや他の場所をオンラインで調べましたが、私の問題に固有のものは見つかりませんでした。他の誰かがそれを経験したのだろうか?そして、彼らはどのように解決しましたか?
マルチワードフィールドのワイルドカード検索を実行しようとしています。これは、最初の単語を入力している間は正常に機能しますが、2番目の単語を入力し始めるとすぐに、最初の単語は無視されます。
私のインデックスの各ドキュメントは1人の人物を表し、インデックス付きフィールド「name」があります。
何が起こるべきか:
「BruceRob」と入力すると、ドキュメント「BruceRobertson」が返されます。
何が起こっている:
「Bru」と入力すると、「BruceRobertson」が返されます。しかし、2番目の単語(たとえば「BruceRob」)を開始するとすぐに、「Rob」で始まる結果が返され始めます。前の単語は完全に無視されます。
PHPクライアントライブラリを使用しています。生成されるクエリは次のようになります。
どんな助けでも大歓迎です。
編集:PHPコード
solr - 位置とオフセット インデックスなしで lucene フレーズはどのように機能しますか?
Lucene では、位置とオフセットを使用して用語をインデックス化できますが、それがなくてもフレーズ検索を使用できます。では、lucene はこの情報なしでインデックスの語順をどのように計算できるのでしょうか?
speech-recognition - Androidで音声ウェイクアップを取得する方法
「こんにちは、ジャック」と言って、AndroidAPPの一部の機能を起動したいと思います。私の知る限り、「こんにちは、ジャック」などの特定の音声を認識する「フレーズスポッティング」という技術があります。しかし、私は「フレーズスポッティング」を実装する考えがありません。
誰かもっとアイデアや提案がありますか?
ありがとう。
java - LuceneIndex-単一の用語とフレーズのクエリ
私はいくつかのドキュメントを読み、次のようなluceneインデックスを作成しました
ドキュメント:
単一の用語とフレーズを組み合わせることができる方法でluceneを照会したいと思います。
私のクエリが
ドキュメントID1、2、3を返す必要があります
クエリ
ドキュメントIDを返す必要があります1
クエリ
ドキュメントID1と3を返す必要があります
クエリ
ドキュメントIDを返す必要があります1
Javaでの私の実装は機能していません。また、大量のドキュメントを読んでも役に立ちませんでした。
インデックスをクエリすると
ヒット数が0
インデックスをクエリすると
ドキュメントID1、2、3を取得します(クエリはfoo AND "john doe"として意図されているため、ドキュメントID 3のみを期待します)問題は、 "john doe"は0ヒットを返しますが、fooは3を返します。ヒット。
私の目標は、単一の用語とフレーズの用語を組み合わせることです。私は何が間違っているのですか?私も運が悪かったのでアナライザーをいじってみました。
私の実装は次のようになります。
インデクサー
サーチャー:
enumerable - フレーズを列挙可能にしますか?
いくつかのカスタマイズされたフレーズ (都市名の束など) を外部からアクセスできるようにする必要があるパッケージを作成しています。(「MyEnum」という名前の通常の列挙型のように、ユーザーが「MyEnum.」と入力すると、列挙されたすべてのメンバーがポップアップしてユーザーが選択できるようになります)
次のようにたくさんの都市名を列挙しようとしましたが、もちろんうまくいきませんでした。
列挙型フィールドでの文字列属性の使用に関する以前の記事もいくつか読みましたが、これらの文字列は外部で使用するためにポップアップすることはできません。
何か役に立ちますか?前もって感謝します。
algorithm - ツリーを配列にフレーズ化
私はこのフレーズツリーを持っています
(ROOT(S(NP(ADJP(JJ Bahasa)(NN daerah)(NN merupakan)(NN bahasa)(NN yang)(NN digunakan)(NN dalam)(NN bahasa)(NN pergaulan)(NN sehari-hari) (NN di)(NN suatu)(NN daerah)(NNP tertentu))(VP(VBZ。))))
このように配列に変換する必要があります
S-> NP VP
NP-> ADJP NN NN NN NN NN NN NN NN NN NN NN NN NN
ADJP-> JJVP-
>VBZ
など...
それらを変換するアルゴリズムはありますか?
c# - テキスト ファイル内の文字列とその前後の文を検索する
検索基準がある場合:She likes to watch tv
text.txt
いくつかの文を含む入力ファイル、例えば:
I don't know what to do. She doesn't know that it's not good for her health. She likes to watch tv but really don't know what to say. I don't blame her, but it's not her fault. This was just a test text. This is the end.
テキストファイル内の文字列を検索し、文字列を含む文とその前後の文を返したい。
出力は次のようになります。
She doesn't know that it's not good for her health. She likes to watch tv but really don't know what to say. I don't blame her, but it's not her fault.
そのため、一致した検索語の前の文、検索語を含む文、検索語の後の文を出力します。
wordpress - wordpress 検索: 検索結果から単語またはフレーズを除外するためのフィールドを作成します
たとえば、ワードプレスで求人掲示板を作成し、「マーケティング」を検索しているが、「コミッションのみ」というフレーズを含むすべての結果を削除したい場合
c# - Html パーサー - C# 正規表現の HTML タグ (div、img、a、h5 など) と属性
Html パーサー - C# 正規表現 html タグ コンテンツ >me im the content< (div、img、a、h5 など) html タグはさまざまな方法で閉じられています。
なぜこれを行うのかと尋ねるかもしれません。Home -> Casa などのフレーズ置換を実行するプロトタイプ コードを継承しました。(スペイン語). ご想像のとおり、「新しい連絡先を追加」など、長さや単語数がさまざまなフレーズ (350 以上) がたくさんあります。
最初の要件: タグの内容を引き出すには正規表現が必要です。出力は次のようになります: 正規表現によって照合されるコンテンツは次のとおりです。これにより、文字列をさらに操作して、句の置換を実行できるようになります。
2 番目の要件: 正規表現によって一致するコンテンツは次のとおりです/> 次のような属性タグのコンテンツを引き出すには、正規表現が必要です。出力は次のようにする必要があります。
HTML Agility Pack を使用して応答しないでください。私は、次のものを見ることを許可しないオーダーメイドの要件を持っています: 整形式の文書。b. クライアント側の XSL 変換 c. コンテンツを決定する Xml データ アイランド。
だから誰でも助けることができます。これまでのところ、私はこの正規表現を使用しています..
ここで質問を過負荷にしないようにしています。さらに詳しい情報が必要な場合はお問い合わせください。私はしばらくの間、速度と正しいマッチングに頭を悩ませてきました。
localization - 動的に構築されたフレーズをローカライズするための推奨されるパターンは何ですか?
パラメータに基づいて存在または削除された部分で動的に構築されるフレーズが与えられた場合、ローカリゼーションをサポートするために考えられる解決策は何ですか? たとえば、動的に挿入された部分を表す太字の部分を持つ次の 2 つの句について考えてみましょう。
- 犬は発見され、犬小屋を持っていて、ボールを追いかけています。
- その犬は白くて、輪になって走っています。
英語の場合、これは単にフレーズ部分を連結するか、パラメーターに基づいて選択できるリソース ファイルにいくつかのトークンで満たされた文字列を含めることで解決できます。しかし、これらのソリューションは、他の言語にローカライズする必要があるか、より多くのパラメーターが必要になると、機能しないか、すぐに醜くなります. 上記の例では、犬の外観が常に存在する唯一の部分であると仮定すると、ローカライズされたリソースの実装は次のリソース文字列で構成される場合があります。
これは機能しますが、必要な文字列の数は、パラメーターの数に応じて指数関数的に増加します。
この課題を解決するのに役立つベスト プラクティスを広く探しています。私が見つけた唯一の解決策は、単純にフレーズを言い換えることですが、自然な文の構造を失うことになります。
- 犬:斑点,犬小屋,ボールを追いかける
提案、リンク、考え、例、または「あなたは頭がおかしい、言い直してください!」フィードバックは大歓迎です:)ありがとう!