問題タブ [search-engine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
search-engine - WikiRank検索
私は検索で新しい概念を作っています。私はltをWikiRankと呼んでいます。これでは、拡張機能がFirefoxブラウザにインストールされます。この拡張機能は、ユーザーアクティビティを監視し、訪問URLとその訪問時間を送信します。また、ユーザーは資料にランキングを付けることもできます。つまり、一言で言えば、。ユーザーインターフェースに変更はありません。ユーザーは検索エンジンを使用しますが、検索されたすべてのWebサイトを収集します。そのため、まもなく、「世界が特定のアイデアと組み合わせたユーザーランクに何時間費やしたか」などのデータが得られるようになります。このデータベースは、より良い検索結果を得るのに役立ちます。このウェブサイトを作成するにはどうすればよいですか?アイデアは良いですか、それともユニークですか?ボットやAIエージェントが誤ったランクを付けるのを防ぐにはどうすればよいですか?すべてのリンクの送信の最後に1つのキャプチャである可能性があります???
javascript - HTML ファイルのコンテンツを検索エンジンから隠すにはどうすればよいですか?
私が特定のトピックに関する記事やドキュメントを書いているとしますが、その内容は、そのトピックに関する特定の予備知識を持つ読者を対象としています。「必要な」背景情報を持っていない人を助けるために、ページの上部に説明と参考資料へのリンクを追加したいと思います。
次に例を示します。
世界一の製品で世界平和をつくる
注: この記事は、あなたが既に The Best Product in the World に精通していることを前提としています。The Best Product in the World の詳細については、公式 Web サイトをご覧ください。
世界最高の製品...
ここで、メモがGoogle検索エンジンの結果に表示されないようにします。タイトルとメモに続くコンテンツのみが表示されるようにします。これを達成する方法はありますか?
また、 Wordpress.comなどのサードパーティがホストするブログなど、HTML ファイル全体や HTTP 応答を直接制御せずにこれを行うことは可能ですか?
アップデート
残念ながら、JavaScript ソリューションと HTML メタ タグ アプローチはどちらも、投稿で JavaScript を許可しておらず、HTML メタ タグを直接編集するためのアクセスを提供していないため、ホストされている Wordpress.com ブログでは機能しません。
web-services - Live Search SOAP サービスの投稿先の URL は?
私は本当に本当に太っている可能性があります。しかし、SOAP を使用するライブ検索 (MSN 検索) の SDK を見てみると、サービスがどこの URL にあるかわかりませんか?? おそらくカプセル化されている C# または VB の SDK をダウンロードできますが、それは役に立ちません (Ruby を使用しています)。
asp.net - Web サイトに埋め込むのに適した検索エンジンは何ですか
Web サイトの自社製検索エンジンを変更することを考えています。Visual Studio について詳しく説明する前に、必要なものを提供してくれる代替案を誰か提案してもらえないかと考えました。これは:
- ASP.NET サイトで動作します (.NET プロジェクトです)
- ファイルベースのインデックスを作成します
- 数百または数千のページにわたる高速検索
- 単語ステミングを実行して、単語のバリエーションを見つけます
- 出力スタイルを完全に制御
- 安い(またはさらに良いことに、無料です!)
algorithm - 検索エンジンの不正確なカウント(約xxxの結果)
グーグルで検索すると(Altavistaが同じことをしたとほぼ確信しています)、「結果1-10の約xxxx」と表示されます...
これはいつも私を驚かせてきました...それは「約」とはどういう意味ですか?
彼らはどのように大まかに数えることができますか?
なぜ彼らが妥当な時間内に正確な数字を思い付くことができないのか私は理解していますが、どうやって彼らはこの「おおよその」数字に到達するのでしょうか?
私が見逃したこの理論の背後には多くの理論があると確信しています...
asp.net - 従来の ASP または ASP.NET の Microsoft Search Server 2008 Express Edition
あるサーバーに Microsoft Search Server 2008 Express Edition を新しくインストールすると、(別のサーバーの) イントラネットのインデックスが適切に作成され、検索サーバー上の提供された検索フォームから検索できます。
検索結果をカスタマイズして、実際にイントラネットで生成されたように見せ、検索フォームのテキスト ボックスと送信ボタンをイントラネット ページ自体に配置したいと考えています。既存の提供された検索フォームは ASP.NET ページのように見え、ポストバックを実行するため、イントラネットの従来の ASP コードでそれを複製することはできません。自分自身を変換/フォーマットする生の XML の直後です。
クエリ パラメータを渡して検索サーバーにアクセスし、ASP または ASP.NET を介して XSLT を使用して変換を実行できる有効な XML を返すことができる URL はありますか?
私が Web で見つけたカスタマイズの記事はすべて、Sharepoint Web パーツの作成と ASP.NET ページでのそれらの使用について言及していますが、それは (Sharepoint Web パーツ) 私が何も知らないものです :(
私は現在、Google Mini アプライアンスで探していることだけを行っています。URL に検索用語を追加して URL を呼び出し、XSLT を使用して、返された XML 検索結果を、少なくともスタイルに関しては私たちの (主に) 従来の ASP イントラネット。ただし、可能であれば、Microsoft Search Server 2008 を使用して同じタスクを実行することを検討したいと考えています。
search-engine - .NETでEndecaを実装した人はいますか? EndecaまたはFASTのどちらをお勧めしますか?
コマース Web サイトに推奨する検索エンジンはどれですか?
カタログには何百万もの製品があり、可能な限り迅速に処理したいと考えています。
また、検索エンジンによるマーケティングが迅速かつ効果的に行われるようにしたいと考えています。
あなたの意見は何ですか?
sql - 検索しやすいようにデータを構造化する方法
音楽プレイリスト専用の検索アプリケーションを作成しています。
ジャンルやファイル形式はプレイリストごとに異なり、プレイリスト内でも異なる場合があります。「同義」タグの概念もあります (たとえば、urban はヒップホップと R&B の両方をカバーしますが、その逆はカバーしません)。
以下は、検索用語と期待される結果のリストです。
gospel: 少なくとも 1 つのゴスペル ソングを含むすべてのプレイリストを返す必要があります。すべてのゴスペル ソングを含むプレイリストが最初に表示されます。Urban: すべての R&B と Hiphop を返す必要があります。ここでも、すべてのアーバン トラックを含むプレイリストが最初に表示されます。hiphop: すべてのヒップホップを返しますが、r&b は返しません。flac: flac ファイルを含むすべてのプレイリストを返す必要があります。純粋なflacのものから始めます。hiphop flac: 最初に Hiphop flacs を返し、次に他のヒップホップ オーディオを返す必要があります。 Hiphop AND flac: Hiphop flacs のみを返す必要があります。
このプロジェクトを始めたばかりなので、これらすべてをインデックス化する最善の方法を考えています。Lucene のような全文検索は、ここで役に立ちますか? これらのプレイリストを説明するテキストはありませんが、生成することはできます。
これらすべての用語を「タグ」として整理し、データベースに多対多で格納することを考えています。
テーブル: プレイリスト ( pk(id), desc ) テーブル: タグ ( pk(id), desc ) テーブル: プレイリスト_has_tag ( pk(link_id, tag_id) )
アーバン == ヒップホップを解決するには || rnb 事、私はおそらく tag_synonyms テーブルを追加します:
表: tag_synonyms ( pk(tag_id, synonym_tag_id) )
次に、アーバンがヒップホップと rnb を包含することを示す 2 つのレコードを作成します: アーバンのタグ ID、ヒップホップのタグ ID、アーバンのタグ ID、RNB のタグ ID
このアプローチを使用すると、クエリが非常に複雑になる可能性があると感じています。
ここで CouchDB を使用できますか? 現在PostgreSQLを使用しています。この種のことを簡単にするソフトウェアはありますか?
将来的には、次のような複雑な検索用語を掘り下げてサポートできるようにしたいと考えています。
(ヒップホップ OR ハウス) AND ファイルタイプ:mp3 AND アートワーク:no
また、期間なども組み込みます。
erlang - Erlang、Mnesia、Yaws を使用して強力な Web 検索エンジンを開発することは可能ですか?
Erlang、Mnesia、Yaws を使用した Web 検索エンジンの開発を考えています。これらのソフトウェアを使用して、強力で最速の Web 検索エンジンを作成することは可能ですか? これを達成するには何が必要で、何から始めればよいですか?
api - Twitter Search API を使用して、過去 5 秒以内にのみ投稿された、検索クエリに一致するすべてのツイートを返すにはどうすればよいですか?
API を使用して、検索クエリに一致するすべてのツイートを返しますが、過去 5 秒以内に投稿されたツイートのみを返したいと考えています。
Twitter の検索 API では、since_id を使用して、特定の ID からすべてのツイートを取得できます。しかし、最初からツイート ID を見つける良い方法がわかりません。
また、実際のクエリで「since:」を使用して日付を使用できることも承知していますが、時間を入力することはできません。
Twitter API の経験がある人から何かアドバイスをもらえますか? 読んでくれてありがとう!