問題タブ [term]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - solr : トークナイザー後にクエリ用語をブーストする方法
検索語が「ABCD」の場合、トークン化すると「A」「BC」「D」になります。用語「BC」をブーストしたいので、クエリ ワードは次のようになります。
ユーザーが入力するすべてのクエリ ワードは、そのように自動的に処理されるため、重要なクエリ タームがブーストされます。
それを行うために新しいトークナイザーをカスタマイズできると思いますが、それが実現可能かどうか、または他のより簡単な方法があるかどうかはわかりません。
emacs - emacs-termで自動ラインカットを無効にする方法は?
emacsターミナルエミュレータを使用しています。GNU Emacs23.2.1とGNUbash、バージョン3.00.0(1)-リリース。grep 1 file.txtなどのコマンドが非常に長い行を出力する場合、emacsはウィンドウ幅に合うようにそれらをトランクします。しかし、それはその行で正しく行われるので、そのような行をコピーすると、単一の長い行ではなく、複数の等幅の行が表示されます。
例えば:
それをエコーした後、cat lorem.ipsum
私が得ると言います(私が38文字の幅の端末を持っている場合):
そして今、それを端末からコピーすると、4行が\n文字で区切られます。それは非常に迷惑です、それをどのように処分するのですか?
emacs - ansi-term内でfont-lock-add-keywordsを使用するにはどうすればよいですか?
次のようにすることで、強調したいキーワードをlisp-interaction-modeなどに簡単に追加できます。
これは、lisp-interaction-modeでバッファを(再)開くとすぐに始まります。
ただし、ansi-termバッファー内でfont-lock-add-keywordsを使用する方法がわかりません。
モードが間違っているのか、それともターム/アンチタームバッファに上記が機能しないような「特別な」何かがあるのかわかりません。
どうやらアンチタームが使用しているメジャーモードである「term-mode」を試してみましたが、うまくいかないようです。
ansi-term内でfont-lock-add-keywordsを使用するにはどうすればよいですか?
lucene.net - 空の文字列フィールドを含むための Lucene.net クエリと回避
正常にクエリできる Lucene インデックスのセットアップがあります。「フィールドが空の文字列と等しくない」という条件を機能させることができません。たとえば、以下のコード例では、3 つの条件が必要です
- 「国タグ」フィールドには「{4ED2F7EE-5C2A-418C-B2F6-236F94166BA1}」が含まれます。
- 「国タグ」フィールドは空の文字列ではありません。
「日付」の範囲は「20110101T000000」から「20121001T000000」までです。
/li>
私はこれを間違っているか、クエリが何らかの形で間違っていると感じています。空のフィールドまたは null フィールドに注意する必要がある条件は必要ありません。
どんな助けでも大歓迎です!
r - R DocumentTermMatrixコントロールリストが機能せず、不明なパラメータを黙って無視します
次の2つのDTMがあります。
これを実装すると、2つの等しいDTMが表示され、を開くとdtmImproved
、3つの記号が付いた単語が表示されます。minWordLength
パラメータが機能しないのはなぜですか?ありがとうございました!
java - Lucene の MoreLikeThis を TermQueries である docFreq が最も高いフィールドに制限するのはなぜですか?
私は現在、自分の目的に合わせて Lucenes MoreLikeThis の修正版に取り組んでいます。まだ理解できないことが一つあります。キューを作成するとき、MoreLikeThis は、この用語の docFreq が最も高いフィールドを検索します。
このフィールドは、TermQuery で使用されます。これにより、奇妙な結果が生じる可能性があります。
たとえば、「タイトル」と「本文」の 2 つのフィールドがあり、まったく同じタイトルのドキュメントが 2 つあるとします。ただし、「タイトル」のすべての単語は他のドキュメントでより頻繁に出現するため、それらは一致しません。 「体」、およびその逆。それは私にはかなり奇妙に思えます。
別の例: ユーザー依存のアクセス許可によって結果をフィルター処理するシステムで使用すると、クエリが生成されたユーザーが、選択したフィールドの高い docFreq の原因となったドキュメントを表示できなかったことが起こりました。生成されたクエリはドキュメントを見つけられませんでしたが、ユーザーが見ることができるドキュメントはたくさんあり、正確な用語が間違ったフィールドに含まれているだけでした。
すべての分野、または少なくともその用語が最初に出現した分野だけを使用しないのはなぜだろうか。確かに、それはパフォーマンスの問題かもしれません。しかし、元のドキュメントで用語が出現するすべてのフィールドと、docFreq が最も高いフィールドを使用するように実装しました。数千のドキュメントを含むインデックスでテストしましたが、違いは見られませんでした (ただし、ベンチマークは行いませんでした)。
では、なぜこのように実装されているのか、誰か教えてもらえますか? 私が考えることができる唯一の理由は、多くのフィールドを持つ非常に大きなインデックスでパフォーマンスを発揮することです。
//編集: 問題を明確にするために最初の例を実装しました: http://pastebin.com/fwdENb3F
wordpress - wordpressでカスタム分類法で投稿をソートする方法は?
「job_listing」という名前の WordPress でカスタム投稿を作成しました。
すべての投稿は「job_listing」の下に保存され、ジョブについてはジョブタイプの情報があります。正社員、アルバイトなど
この job_type はタームに格納されており、すべての求人/投稿を job_type で検索して並べ替えたいと考えています。
誰でも解決策を持っていますか?
emacs - PWD に基づいて多項バッファー名を更新する
konsole または他の端末を使用する場合、端末タグ名は PWD に基づいて変更される可能性があります。しかし、マルチタームでは、バッファ名は*terminal<number>*
. これはあまり良くありません。それらを切り替えると、名前はあまり有益ではないためです。だから私はPWDに基づいて名前を変更したい.
Enter keyがterm-send-rawにバインドされていることがわかったので、関数を記述します
しかし、問題はターミナルバッファのpwd
コマンドリターンですが、そのターミナルのではありません。PWD
PWD
SHELL
PWD
端末バッファの は によって設定されますdefcustom multi-term-default-dir
。PWD
で変更しても変わりませんSHELL
。
ターミナルでシェルの PWD を取得するにはどうすればよいですか?
よろしく。
solr - SOLR用語の頻度
私はsolrを使用していますが、これまでのところすべてが順調に進んでいます。検索を行うとき、ドキュメント自体とともに、ドキュメントごとに検索「用語」が何回あったかを取得したいと思います。私はたくさんの情報を見つけましたが、それを調べた後、私はまだこれを行う方法を理解していません。そんなに大変ですか?
誰かが私を助けることができますか?
結果は得られますが、flフィールドは常に0です。
apache - Solr/Lucene 結果フィールドの用語数
solrを使って検索しています。その結果、一連のフィールドが返されます。フィールドの 1 つが「ドメイン」です。ドメイン フィールドは私のデータベースでは多対多の関係であるため、私のドキュメントにはリンク先の「ドメイン」の配列が含まれています。
私がやりたいことは、結果セットの各ドメインについて、この「ドメイン用語」がグローバル結果セットで見つかった回数を数えることです。
どうすればいいですか?