問題タブ [phrase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
43 参照

notepad++ - メモ帳 ++ 行に重複したフレーズを削除する

送信されたデータがいくつかありますが、何らかの理由で、送信者は次のようにデータを 3 回並べてコピーすることができました。

すべての重複を削除する必要があり、データには 22,000 行をわずかに超えています。Notepad ++の行で重複したフレーズを削除する方法はありますか?

0 投票する
2 に答える
4431 参照

search - エラスティック サーチ完全一致フレーズ

私はESが初めてです。完全に一致するフレーズを見つけることができません。

インデックスに movie_name というフィールドがあるとします。次の値を持つ 3 つのドキュメントがあるとします。

  1. movie_name = マッドマックス
  2. movie_name = マッドマックス
  3. movie_name = マッドマックス 3D

検索クエリが Mad Max の場合、最初の 2 つのドキュメントは返されますが、3 番目のドキュメントは返されません。

「not_analyzed」ソリューションを実行すると、ドキュメント 1 のみが取得され、2 は取得されません。

私は何が欠けていますか?

0 投票する
1 に答える
100 参照

java - Javaは文字列を数値の配列に変換します

文字列からすべての数値を抽出するJava関数があることを知りたいです。文字列の例:

"Preostalo stanje u Zicer tarifi: 248 分 0 秒、497 SMS、220 MB。Tarifa vrijedi do 01.06.2015." 284 と 0、497、220 と日付を抽出したいと思います。

同じ関数は、「Trenutacno imas 326 Bonus MB koji ti vrijede do 02.06.2015」のような他のタイプの文字列を抽出する必要があります。326 と日付を抽出する場所。

「Imas jos 42:39 od 50 minuta razgovora. Imas jos 81 od 150 poruka. Imas jos 118,0176MB. Nemas aktiviranu opciju 1000 bonbon minuta i SMS-ova :(」のような文字列。

数値文字が見つかるまで文字列をたどってそれを表現する関数を作成できると思いましたが、それは複雑に思えます。

0 投票する
1 に答える
390 参照

solr - Solrのマルチワードストップワード

stopwords.txt ファイルで「作成プロセス」、「準備方法」などの語句を使用するにはどうすればよいですか。ここに記載されている解決策を試しましたが、成功しませんでした。

0 投票する
1 に答える
144 参照

search - Lucene フレーズ クエリとトークン化されたインデックス作成

フレーズ クエリを使用して lucene のトークン化されたインデックスを検索すると、奇妙な問題が発生します。

次の方法でインデックスを作成します

WhitespaceAnalyzer を使用して値をトークン化します。文字列「T-Test」を検索したい場合は、結果として値T-Test 1、T-Test 2、T-Test 3、T-Testを取得します

次の方法でクエリを作成します。

同じ効果で ComplexPhraseQueryParser も使用してみました。すべての T-Test 値を取得するだけです。しかし、「T-Test 1、T-Test 2、および T-Test 3」ではなく、T-Test だけが必要です。私は絶望的になりそうです ありがとう

0 投票する
1 に答える
491 参照

text - 単語のペアとフレーズの tm_term_score エラー

tm_term_score を使用して行内のテキストに対して用語フレーズまたは用語ペアを 1 または 0 としてスコア付けしようとすると、次のエラーが発生します。

UseMethod("tm_term_score", x) のエラー: クラス "c('VCorpus', 'Corpus')" のオブジェクトに適用される 'tm_term_score' に適用可能なメソッドがありません

str(terms) chr [1:61] 「学びを助ける」 「成長を助ける」 .