問題タブ [indexing-service]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ocr - Indexing Service と MODI を取得して OCR 経由で全文を生成するにはどうすればよいですか?
ファイルにインデックスを付けるように Indexing Service を構成しました。これには、高解像度TIFFファイルとして保存されたスキャン画像も含まれます。また、MS Office 2003+ をインストールし、MS Office Document Imaging (MODI) を正しく構成したので、画像に対してOCRを実行し、 OCRされたテキストを TIFFに埋め込むことさえできます。
Indexing Service は、手動で OCR され、テキスト データと共に再保存されたTIFFを (MS Document Imaging ツールを使用して) インデックス付けして検索することができます。
Windows XP SP2 で導入されたデータ実行防止 (DEP) は、MODI を悪意のあるものと見なし、その魔法の実行を拒否することが判明しました。DEP を完全にオフにすることで動作させることができましたが、この解決策は洗練されていないことがわかりました。
DEP を無効にせずに、これを機能させるためのより良い解決策はありますか?
windows-xp - Windows インデックス作成の「アクティビティ」を強制する方法
Windows インデックス サービスは、「ユーザーがアクティブ」であることを検出すると一時停止します。ユーザーのアクティビティに関係なくインデックス作成を継続するためのレジストリエントリまたは何かがありますか?
明確化: Windows XP の場合
file - 一部の PDF とドキュメントを参照できない
私は、Microsoft Indexing Service を使用して、pdf、rtf、mht、および doc のさまざまなドキュメントを保持するディレクトリにインデックスを付けてクエリを実行する Web サイトを持っています。インデックス作成とクエリは (ほとんどの場合) うまく機能します。ただし、ロードされるファイルとロードされないファイルがあります。
これは、IIS 6 を使用してサイトを実行している Windows Server 2003 ボックスです。
インデックス化されたディレクトリは、サイトのルート ディレクトリ (つまり、http://my.domain.com/files/ ) のサブ ディレクトリです。
URL のファイル パスは正確です。ただし、各ファイル タイプの一部のファイルにしかアクセスできません。アクセスできないファイルは、404 File Not Found になります。Windows エクスプローラー経由ですべてのファイルを開くことができますが、http 経由でブラウザー経由でファイルを開こうとすると失敗します。
誰かがこの問題を経験し、それを解決する方法を知っていますか? 一部のファイルにアクセスできたのに他のファイルにアクセスできなかった理由を知っている人はいますか? これを試すために何を調べるべきかについての推奨事項はありますか (つまり、所有者は重要ですか?)?
編集: 不良ファイルの要求ヘッダーと応答ヘッダーは次のとおりです。
GET /files/file1.pdf HTTP/1.1 Accept: image/gif、image/jpeg、image/pjpeg、image/pjpeg、application/x-shockwave-flash、application/xaml+xml、application/vnd.ms-xpsdocument、 application/x-ms-xbap、application/x-ms-application、application/x-silverlight、application/vnd.ms-excel、application/vnd.ms-powerpoint、application/msword、/ Accept-Language: en-usユーザーエージェント: Mozilla/4.0 (互換性あり; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; .NET CLR 3.0.04506.590; . NET CLR 3.0.04506.648; .NET CLR 3.5.21022; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729) Accept-Encoding: gzip、deflate Proxy-Connection: Keep-Alive Host: my.domain.com
HTTP/1.1 404 Not Found Content-Length: 1635 Content-Type: text/html Server: Microsoft-IIS/6.0 X-Powered-By: ASP.NET Date: Mon, 01 Jun 2009 15:38:54 GMT [typ. 404ページのマークアップは除外]
正常なファイルの要求/応答ヘッダーは次のとおりです。
GET /files/file2.pdf HTTP/1.1 Accept: image/gif、image/jpeg、image/pjpeg、image/pjpeg、application/x-shockwave-flash、application/xaml+xml、application/vnd.ms-xpsdocument、 application/x-ms-xbap、application/x-ms-application、application/x-silverlight、application/vnd.ms-excel、application/vnd.ms-powerpoint、application/msword、/ Accept-Language: en-usユーザーエージェント: Mozilla/4.0 (互換性あり; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; .NET CLR 3.0.04506.590; . NET CLR 3.0.04506.648; .NET CLR 3.5.21022; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729) Accept-Encoding: gzip、deflate Proxy-Connection: Keep-Alive Host: my.domain.com
HTTP/1.1 200 OK Content-Length: 352464 Content-Type: application/pdf Last-Modified: Tue, 13 Jan 2009 15:27:35 GMT Accept-Ranges: bytes ETag: "74ccc5759375c91:2a47" サーバー: Microsoft-IIS/ 6.0 X-Powered-By: ASP.NET 日付: 2009 年 6 月 1 日月曜日 15:50:33 GMT
asp.net - Web.Config のインデックスを作成しない場合、Windows インデックス サービスはアプリ プールを再起動できますか?
私はこの件について同僚と少し議論しています。
シナリオ: Web サイトには、Windows インデックス サービスを使用してインデックス付けされたサブ ディレクトリがあります。このディレクトリには web.config がなく、インデックス サービスはサイト ルートである親ディレクトリのインデックスを作成していません。何かが原因で、おそらくランダムな時間にアプリ プールが再起動します。
私がオンラインで見つけたものから、Windows インデックス サービスがアプリ プールの再起動を引き起こすのは、web.config (または machine.config) のインデックスを作成している場合のみです。私の同僚は、ルートの子フォルダーにあるという理由だけで、インデックス サービスが再起動を引き起こしていると言っています。
それで...誰かこれに関する情報や経験を持っていますか?インデックス サービスがルート ディレクトリ自体ではなく、ルートの子フォルダーのインデックスを作成している場合、IIS がサイトのアプリ プールを再起動することはありますか?
編集: 問題のサブディレクトリは bin ディレクトリではありません。私はそれがそのような原因になることも知っています。ただし、bin ディレクトリはインデックス サービスの対象ではありません。
sharepoint - IFilter に渡された写真を処理するにはどうすればよいですか?
画像形式のインデックスを作成するために IFilter を実装しています。問題の 1 つは写真です。多くのユーザーは大量の写真を所有しており、写真は巨大であり、テキストの読み込みと検索に時間がかかります。
はい、ドキュメントをデジタル化するためにスキャナーの代わりにカメラを使用する人もいますが、IMO の潜在的な問題は、写真カメラでデジタル化されたドキュメントに遭遇する可能性をはるかに上回ります。したがって、私の実装では、写真からテキストをまったく抽出しません。
指定されたファイルが写真画像であることを検出したら、IFilter は何をすべきでしょうか? エラーを示すか、空のテキストを返しますか?
indexing - ダッシュまたはドットが含まれるリモートサーバー名とインデックスサーバーが通信する際の問題
こんにちは私は問題があり、リモートインデックスサーバーカタログにアクセスしています。サーバーの名前には-が含まれているので、インデックスカタログ名を次のように入力します。
つまり、num.num.num.num\nameのカタログまたはan-example-server
oleデータ接続を使用してインデックスから結果をプルすると、次のエラーが発生します。
「初期化文字列の形式が、インデックス39以降の仕様に準拠していません」
一重引用符と&qoute;を入れてみました 運がない-誰かが考えを持っていますか?
PS。このMicrosoftIndexServerの質問!
c - Windows ファイルのインデックス作成がオンかオフかを確認する方法
ファイルのインデックス作成がオンかオフかを確認するために使用できる C の API はありますか? コードは大歓迎です。
c# - インデックスサービス:カスタムプロパティで空の列を取得する
私はこの例に従っています:http: //www.codinghorror.com/blog/2005/12/getting-started-with-indexing-service.html
ただし、データセットへの変換では、カスタムプロパティの空の列が表示されます。列にパスまたはファイル名を使用すると、データが返されます。プロパティをキャッシュするように設定し、両方のレベルを試し、完全に再スキャンしました。
デスクトップ(Windows Vista 32ビット)とWindows 2008 R2サーバーでこの例を試しましたが、同じ結果になりました。
indexing-service - インデックス サーバーの問題
Index Server で問題が発生している HTML ファイルを持っています。これが問題のテキストです。
(B) 1 マイルあたり10,800 ドル
(C) リニア マイルあたり40,000 ドル
私の問題は、太字のテキストにあります。
- 800を検索すると、ドキュメントが見つかります
- $10を検索すると、ドキュメントが見つかります
- $40を検索すると、ドキュメントが見つかります
- $10,800、10,800、$40,000または40,000を検索すると、テキストを二重引用符で囲んでいるかどうかに関係なく、ドキュメントが見つかりません。
おそらくコンマだと思いましたが、40,000 のインデックス サーバー リポジトリで他のドキュメントを見つけることができ、それを見つけることができます。
何か案は?
c# - リモート インデックス サービス データベースのクエリ
ASP.NET からリモート Windows 2003 サーバーのインデックス サービスを検索しようとしています。MS サイトにこのサンプル コードがありますが、ローカル検索のみです。これが私がこれまでに得たものです。この例のリモート サーバーは「indexserver」と呼ばれ、ドメイン上になく、「system」と呼ばれるインデックスを持っています。
これを実行すると、「複数ステップの OLE DB 操作でエラーが発生しました。利用可能な場合は OLE DB ステータスを確認してください。作業は行われませんでした」というエラーが表示されます。
これを機能させる方法を知っている人はいますか?私がする必要があるのは、ファイル名のインデックスを照会し、そのファイルのパスを取得することだけです。