問題タブ [search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 検索ランキング/関連性アルゴリズム
ナレッジ ベースの記事のデータベースを作成する場合 (たとえば)、ユーザーの質問に対する最も関連性の高い回答を並べ替えて表示するには、どのような方法が最適でしょうか?
以前のユーザーがヘルプ記事を見つけたかどうかに基づいて、キーワードの重み付けなどの追加データを使用しますか?それとも単純なキーワード マッチング アルゴリズムで十分だと思いますか?
ruby-on-rails - サイトにフル Web 検索を追加する最良の方法は?
サイトに完全な Web 検索を追加する必要があります。Google カスタム検索のようなものが必要ですが、広告がなく、無料でなければなりません。私のサイトにインデックスを付けて検索できるようにする Web サービスまたはオープン ソース プロジェクトの推奨事項は役に立ちます。
私のサイトは ruby on rails で作成されています。
私の下手な英語を編集できるように、この質問をコミュニティ ウィキにします。多くの人がこの質問から恩恵を受けることができると思います。
sql - 検索しやすいようにデータを構造化する方法
音楽プレイリスト専用の検索アプリケーションを作成しています。
ジャンルやファイル形式はプレイリストごとに異なり、プレイリスト内でも異なる場合があります。「同義」タグの概念もあります (たとえば、urban はヒップホップと R&B の両方をカバーしますが、その逆はカバーしません)。
以下は、検索用語と期待される結果のリストです。
gospel: 少なくとも 1 つのゴスペル ソングを含むすべてのプレイリストを返す必要があります。すべてのゴスペル ソングを含むプレイリストが最初に表示されます。Urban: すべての R&B と Hiphop を返す必要があります。ここでも、すべてのアーバン トラックを含むプレイリストが最初に表示されます。hiphop: すべてのヒップホップを返しますが、r&b は返しません。flac: flac ファイルを含むすべてのプレイリストを返す必要があります。純粋なflacのものから始めます。hiphop flac: 最初に Hiphop flacs を返し、次に他のヒップホップ オーディオを返す必要があります。 Hiphop AND flac: Hiphop flacs のみを返す必要があります。
このプロジェクトを始めたばかりなので、これらすべてをインデックス化する最善の方法を考えています。Lucene のような全文検索は、ここで役に立ちますか? これらのプレイリストを説明するテキストはありませんが、生成することはできます。
これらすべての用語を「タグ」として整理し、データベースに多対多で格納することを考えています。
テーブル: プレイリスト ( pk(id), desc ) テーブル: タグ ( pk(id), desc ) テーブル: プレイリスト_has_tag ( pk(link_id, tag_id) )
アーバン == ヒップホップを解決するには || rnb 事、私はおそらく tag_synonyms テーブルを追加します:
表: tag_synonyms ( pk(tag_id, synonym_tag_id) )
次に、アーバンがヒップホップと rnb を包含することを示す 2 つのレコードを作成します: アーバンのタグ ID、ヒップホップのタグ ID、アーバンのタグ ID、RNB のタグ ID
このアプローチを使用すると、クエリが非常に複雑になる可能性があると感じています。
ここで CouchDB を使用できますか? 現在PostgreSQLを使用しています。この種のことを簡単にするソフトウェアはありますか?
将来的には、次のような複雑な検索用語を掘り下げてサポートできるようにしたいと考えています。
(ヒップホップ OR ハウス) AND ファイルタイプ:mp3 AND アートワーク:no
また、期間なども組み込みます。
regex - 正規表現検索および置換プログラム
テキスト ファイルを検索し、文字列を正規表現に置き換えるシンプルで軽量なプログラムはありますか?
performance - Web 2.0 サイトで、新しく追加されたタグが表示され、検索用にインデックス化されるまでにかかる時間 (秒) は?
私はタグ付け機能を備えた Web 2.0 サイトを構築しており、システムが a) 特定のレコードに新しいタグを表示し、b) 検索用にタグをインデックス化するのにかかる時間 (秒) を、経験のある人から知りたいと考えていました。 . たとえば、新しく追加されたタグは 1 秒で検索できるようになる必要がありますが、ユーザーの画面には 0.1 秒で表示される必要がありますか?
search - 複数のファイルに置き換える-Linux用のグラフィカルツール
グラフィカルである必要があります。sed、awk、grep、perlなどはありません。私はそれらの使い方を知っていて、今は使っていますが、300以上のファイルでそれぞれの置換を選択する必要があります。
次のことができるツールが必要です。
- 検索文字列を入力します
- 置換文字列を入力します
- ディレクトリとファイル拡張子を選択します
そして、そのディレクトリとそのサブディレクトリ内の各ファイルに再帰的に移動し、それを開いて検索文字列がある場所までスクロールし、2つのオプションを提供します。
- 交換(そして次を見つける)
- 次を見つける
これ以上何もない。Reg.exp。サポートはプラスですが、必須ではありません。
解決済み:Regexxerはまさに私が必要としていたものです。誰かがSlackwareでそれを必要とする場合に備えて、ダウンロードする必要があるものとそれをコンパイルする方法を示します(各依存関係の正しいバージョンを選択することはPITAになる可能性があります)
regex - シーケンスを含むが異なるシーケンスを含まない行を見つけるための正規表現
665 を含み、.pdf を含まないすべての行を検索する正規表現を作成するにはどうすればよいですか?
正規表現で行う方法が見つからないようです。重要な場合、これは Notepad++ 構文用です。
ありがとう
.net - バイト[]を検索しています
文字列内の文字列の検索は .NET で非常によくサポートされていますが、検索する必要があるデータが文字列ではない場合はどうすればよいでしょうか?
NetworkStream を介して通常のチャンクで到着するバイナリ データがあります。パケットはバイナリですが、すべてバイトのシグネチャ シーケンスで始まります。チャンクをより大きなバッファーに蓄積し、パケット開始の署名を探します。
私が本当に探しているのは、メソッドbyte[]
と同等です。String.IndexOf(ss)
ループとステートマシンを使ってこれを自分で実装しなければならなくなる気がします。
助言がありますか?あなたに!
示唆されているように、 Array.IndexOf(byte) は少なくとも明示的なループを節約します。投稿以来、最初の署名バイトを見つけて、最後の署名バイトがあるべき場所を先に調べて、両方が一致する場合は、文字列の残りの部分を力ずくで比較してみることにしました。このアプローチには、誤った一致を安価に拒否し、別のチャンクを保留している部分的な署名がある場合に安価に拒否できるという利点があります。
Googleは、上記の素晴らしい計画が「KMP」またはKnuth-Morris-Prattアルゴリズムの退化したケースであることを明らかにしています. 明るい面では、クヌースが彼の名前を付けた場合、それはおそらく油を塗った稲妻です.
ドナルド・クヌースにポイントを与えることはできないので、ネルソンに行くと思います。
c++ - フォークを使用してファイル内の文字列の検索を並列化する方法は? (GNU Linux/g++)
数行のテキスト ファイルを取得し、このファイルで文字列を探しています。次のコマンド ライン パラメーターをプログラムに渡す必要が
あり
ます
。
そのようなプログラムはどのように構築されるべきですか?