問題タブ [indexing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tsql - T-SQLのテーブルの補助スキャン記述子の数を最小限に抑えるにはどうすればよいですか?
最近、次のようなエラーメッセージを表示するレガシーシステムのストアドプロシージャで問題が発生することがあります。
サーバーメッセージ:番号10901、重大度17:このクエリにはX個の補助スキャン記述子が必要ですが、現在使用できる補助スキャン記述子はY個だけです。'Auxスキャン記述子の数'構成パラメーターの値を上げるか、後で照会を試してください。
ここで、XはYよりわずかに低いです。Sybaseのマニュアルには、補助スキャン記述子を少なくするようにテーブルを再設計するか(どのように?!)、システムで使用可能な数を増やす必要があると書かれています。奇妙なことに、それは何年も正常に機能していて、変更された唯一のことは、いくつかの列のデータ型を修正し、インデックスを追加したことです。誰かがこれに光を当てることができますか?
indexing - Nexus CMS - Google 検索アプライアンスのインデックス登録
このCMSを使っている人はいますか?私はそれについてあまり知りません.GSA(Google検索アプライアンス)でそれを使用して構築されたサイトをインデックス化する必要がありますが、彼らのWebサイトにはそれに関するドキュメントがほとんどありません.
落とし穴があるかどうか、どのタイプのデータベースを使用するか..
ありがとう。
search - Lucene.Net は、頻繁に変更されるコンテンツの検索エンジンとして適していますか?
Lucene.Net は、頻繁に変更されるコンテンツの検索エンジンとして適していますか?
より具体的に言えば、lucene.net インデックスの更新速度について主観的な意見を言える人はいますか? 頻繁に変化するコンテンツを検索するための他のアプローチは素晴らしいでしょう。
私たちはフォーラムを開発しています。フォーラムの投稿は、フォーラム リポジトリに頻繁に追加されます。検索できるようにするには、これらの投稿を lucene インデックスにすばやく (0.5 秒未満で) 追加する必要があると考えています。最初のリポジトリには約 5E6 の投稿があります。非エキゾチックなサーバーで実行されている検索エンジンを想定します (これは非常に漠然としています!)。
頻繁に変更されるコンテンツの検索の問題に対処することに関するその他の提案を歓迎します。フォーラムの投稿は、可変数の名前付きタグで検索可能である必要があります (タグ名と値が一致する必要があります)。SQL ベースのアプローチ (Toxi スキーマに基づく) では、必要なパフォーマンスが得られません。
sql-server-2005 - SQL Server 2005 で PDF ファイルの全文検索を使用する
SQL Server 2005 で PDF ファイルのインデックスを作成する際に奇妙な問題が発生しました。誰かが助けてくれることを願っています。私のデータベースには、MediaFileId int identity pk、FileContent image、および FileExtension varchar(5) というフィールドを持つ MediaFile というテーブルがあります。問題なくこのテーブルにファイルの内容を保存する Web アプリケーションを持っており、問題なく doc、xls などの全文検索を使用できます - 動作しない唯一のファイル拡張子は PDF です。このテーブルで全文検索を実行して、テーブルに保存された PDF ファイル内に存在することがわかっている単語を検索すると、これらのファイルは検索結果に返されません。
OSはWindows Server 2003 SP2で、Adobe iFilter 6.0をインストールしています。このブログエントリの指示に従って、次のコマンドを実行しました。
この後、SQL Server を再起動し、次のコマンドを実行して、PDF 拡張機能の iFilter が正しくインストールされていることを確認しました。
これにより、正しいように見える次の情報が返されます。
document_type: .pdf
パス: C:\Program Files\Adobe\PDF IFilter 6.0\PDFFILT.dll
次に、MediaFile テーブルにインデックスを (再) 作成し、インデックスを作成する列として FileContent を選択し、そのタイプとして FileExtension を選択しました。ウィザードはインデックスを作成し、正常に完了します。テストするために、次のような検索を実行しています。
これにより、この用語を含む DOC ファイルが返されますが、PDF ファイルは返されませんが、テーブルにはhouseという単語を含む PDF ファイルが確実に存在することがわかっています。
ちなみに、上記の検索で正しいPDFファイルが返された数分間、これが機能するようになりましたが、明らかな理由もなく再び機能しなくなりました.
Adobe iFilter がインストールされ、読み込まれているように見えますが、SQL Server 2005 が PDF のインデックス作成を停止している原因について何か考えはありますか?
database - PHP を使用した SQL への重複挿入の防止
SQL に対して何千ものクエリを実行する予定であり、フィールド「ドメイン」の重複を防ぐ必要があります。これまでにこれを行う必要はありませんでした。
sql-server - 外部キーは SQL Server で自動的にインデックス付けされますか?
次の SQL ステートメントは、Table1.Table1Column にインデックスを自動的に作成しますか、それとも明示的に作成する必要がありますか?
データベース エンジンは SQL Server 2000 です
sql - SQLでの式の索引付け
一般的なクエリの 1 つに "where blobCol is null" があるデータベースがありますが、これはパフォーマンスが低下していると思います (完全なテーブル スキャンのように)。blobCol のコンテンツにインデックスを付ける必要はありません。
これを改善するインデックスは何ですか? 列だけでなく、式 (blobCol が null ではない) に基づいてインデックスを作成できますか?
database - 「部分インデックス」を使用する利点と欠点は何ですか?
PostgreSQL では、基本的に条件述語を含むインデックスである「部分インデックス」を作成できます。http://www.postgresql.org/docs/8.2/static/indexes-partial.html
テスト中に、クエリが 12 万行のテーブル内の特定の 12 行のみにアクセスしている場合に、それらが非常にうまく機能することがわかりました。
しかし、これを展開する前に、知っておくべき欠点や注意事項はありますか?
sql-server - SQL SERVER での大きなテーブルのインデックス作成
大きなテーブル (1,000 万件以上のレコード) があります。このテーブルは、アプリケーションでの検索に頻繁に使用されます。そのため、テーブルにインデックスを作成する必要がありました。ただし、レコードがテーブルに挿入または更新されると、パフォーマンスが低下します。これは、インデックスの再計算が原因である可能性が最も高いです。
これを改善する方法はありますか。
前もって感謝します
database - ほぼ一意のフィールドにインデックスを付ける必要があります
データベースにほぼ一意のフィールドがあります。値は 98% の確率で一意ですが、いくつかの重複がある可能性があります。このフィールドで多くの検索を行うことはありません。月に2回言う。現在、テーブルには約 5000 件のレコードがあり、1 か月あたり約 150 件増加します。
このフィールドにはインデックスが必要ですか?
私はMySQLを使用しています。