問題タブ [dtsearch]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
search - プロプライエタリ データの検索にどちらを使用するかの決定に影響を与える検索エンジンの主な違いは何ですか?
プロプライエタリ データの検索に使用する検索エンジン (DtSearch、Lucene.net、Sphinx、Google など) の主な違いは何ですか?
検索対象のデータは、名前と値のペアの形式のメタデータでマークアップされたプレゼンテーションのないデータで構成されます。さまざまなツールのフォーマット解析機能には関心がありません。また、検索結果は、他の (同様に構造化されたリポジトリ.
決定を通知する必要があるいくつかの関連する検索エンジンの特性を以下に示します。さらなる提案や経験の説明を歓迎します。
• コスト • 使いやすさ • 特定のタグのみを返すように構成できます • 特定の用語を「識別」して、検索結果にこれらの結果の重み付けを高くすることができます • 検索結果または %E6 レコード/ドキュメントを返すのに 0.3 秒未満の高速 • タイプ付きのタグをサポートします(find weather='sunny' but not person=sunny) • 関連性ランキングを与える重み付けをサポート • 関連性によってランク付けされた順序で結果を返す • シノニムをサポート • ステミングをサポート • ストップ ワードをサポート • スペル修正をサポート • 並列化またはインデックス構築に対応 (インデックスベースの場合) • インデックスの再作成が速い (インデックスベースの場合) • インデックスの更新が速い (インデックスベースの場合) • 複数のインデックスからの結果を結合する (インデックスベースの場合) • 近接チェック: 近くにある単語に高い関連性を与える
asp.net - Lucene.net は 100 万アイテムの製品データベースの Web サイト検索に適していますか? (SQL Server 2005 の全文検索をあきらめる)
現在、本番環境で SQL Server 2005 を使用しており、100 万の製品データベースの e コマース サイト検索に全文検索を使用しています。可能な限り最適化しましたが (と思います)、検索時間はまだ 5 秒です。
(サイトのスクロールや PDF (など) のドキュメントのインデックス作成機能は必要ありません... サイト検索には「Google」の速度だけが必要です。)
dtSearch を購入するつもりでしたが、Lucene.net を使用するだけで、2 つのサーバー ライセンスで 2,500 ドルを節約できることに気付きました。
Lucene.Net は Web サイトの検索には適していないという投稿を読みました。
他の誰かが ASP.Net から Lucene.Net を使用しましたか? それは多くのメモリを必要としますか?
問題はありますか?
コメントはありますか?
dtsearch - dtSearch で、フレーズごとに 1 つのヒットを強調表示するのではなく、フレーズごとに 1 つのヒットを強調表示するようにする
dtSearch を使用して、ドキュメント内のテキスト検索の一致を強調表示しています。これを行うためのコードは、いくつかの詳細とクリーンアップを除いて、おおよそ次の行に沿っています。
dtSearch に次のような引用句クエリを指定すると、
"監査証跡"
次に、dtSearch は次のようにヒットの強調表示を行います。
<a name="HH_0"/><b>監査</b> <a name="HH_1"/><b>トレイル</b>は、<a name="HH_2"/ ><b>監査</b> <a name="HH_last"/><b>トレイル</b>について!
フレーズの各単語が個別に強調表示されていることに注意してください。代わりに、次のようにフレーズをユニット全体として強調表示したいと思います。
<a name="HH_0"/><b>監査証跡</b>は、<a name="HH_last"/><b>監査証跡</b>を持つと楽しいものです!
これにより、A) ハイライトの見栄えが良くなり、B) ユーザーがヒットからヒットへと移動するのに役立つ JavaScript の動作が改善され、C) 合計ヒット数のより正確なカウントが得られます。
このように dtSearch でフレーズを強調表示する良い方法はありますか?
c++ - Linux の C++ で dtsearch を使用できますか? はいの場合、どの API を使用すればよいですか?
C++ および Gtkmm で記述されたデスクトップ アプリケーションでdtsearchを使用したいと考えています。自分のことをするために、API または API へのリンクを使用できますか。
sitecore - 複数の Web サイトを含む Sitecore dtSearch 構成
Sitecore で dtSearch を使用して 2 つのインデックスを検索できるようにするにはどうすればよいですか? Sitecore のドキュメントでは、configs に複数のインデックスを追加することについて何も見つかりません。
c# - DTSearch COM相互運用機能-オブジェクトをC#に公開するにはどうすればよいですか?
私はここでギャンブルをしていることを知っています。私もこれで助けられることができるかどうかはわかりません。しかし、ここに問題があります。
私が働いている会社には、C++ソースを含むDTSearchの完全にライセンスされた開発者用コピーがあります。彼らは私が更新しているアプリケーションでこれを使用します。現在取り組んでいるこのアプリへのC#の追加でそれを利用するように言われました。しかし、私は.NETアセンブリを持っておらず、何らかの理由でそれを実装することを拒否しています。
そのため、オブジェクトブラウザでdtengineを簡単に表示でき、それらを使用するのを待っている素敵なオブジェクトがたくさんあります。しかし、それらのどれもインスタンス化されません。それを試みると私は得ます
'dtengine.SearchJobClass'を埋め込むことはできません。代わりに、該当するインターフェースを使用してください。
そして、たくさんのインターフェースがあり、私はそれらのどれでも簡単に実装できます。問題は、「新しいNotImplementedExceptionをスローする」では、検索が正確に実行されないことです。
誰か手がかりはありますか?
localization - dtSearch/Luceneを使用してSitecoreで中国語を検索する
Sitecoreで中国語のサイト(繁体字および簡体字)を構築することを検討しており、検索をサポートする可能性がどこにあるのか疑問に思っていました。
私がこれまでに集めたものから:
- Luceneはそのままではサポートしていませんが、中国語検索を可能にするために開発またはサードパーティを通じて拡張できます
- dtSearchはそれをサポートするはずですが、私が見つけたものから、それは信頼できない/テストされていません。
Sitecoreで中国語を使用して検索を実行した経験のある人はいますか?Luceneに中国語を実装した経験はありますか?
どんな助けでもいただければ幸いです。
乾杯、フィル
c# - DtSearch 検索で、検索ジョブの制限を超えるファイルが見つかりました
まあ、それは私の dtsearch 実装にほとんど当てはまります。その例外が発生していますが、奇妙なことがいくつかあります。
デバッグ中の同じコードは完璧に動作します 開発とサーバーのインデックスは、dtSearch デスクトップで同じオプション設定を使用して作成されます HTML ドキュメントの別のインデックスが完全に動作する同じコードであると断言できます
DtSearch のサポートによると、インデックス作成設定とインデックス検索設定には違いがある可能性があります。これらの設定を定義するのをやめ、デフォルトとして動作するようにします。
数週間前、すべてがスムーズでした。各インデックスに特定の検索設定を設定しようとしたことを除いて、何をしたか正確には覚えていません。次に、それらの行にコメントを付けました。概要を実装しようとしましたが、機能しないため、それらの行にコメントしました。
私はそれが創造と検索と関係があるとは本当に思いませんが、何か他のものと関係があります.
皆さん、ありがとうございました
java - エラー UnsatisfiedLinkError を修正する方法: C:\Program Files\dtSearch Developer\bin\dtsjava.dll: オペレーティング システムは %1 を実行できません
J2EE を使用しています。Windows XP に dtSearch エンジン ツールをインストールしました。すべての環境変数を設定しましたが、コンソールに上記のエラーが表示されます。
何が起こっているのか誰にも分かりませんか?教えてください?
full-text-search - fts ドキュメント レベルのインデックス作成、ページ レベルの結果の取得 (dtSearch の例を使用)
これは必ずしも dtSearch 固有の質問ではありません (たとえば、fts エンジンの質問に似ています) が、複数のページで構成されるドキュメントをインデックス化し、ページ レベルのヒット結果を取得する方法を扱います。
私はグーグルで検索しましたが、何も見つかりませんでした。したがって、私の質問は次のとおりです。
m 本からスキャンされた n 個の tiff ページがたくさんあります。それらをOCRし、全文索引を付け、検索を実行します。
検索結果を書籍レベル (たとえば、検索結果に 1 冊の本が含まれている必要があります) にするだけでなく、ページ レベルで見つかったアイテムを取得できるようにすることも必要です (ヒットの強調表示を効率的に実行できるようにするためです。SomeTermはページ 1、ページ 2、およびページ 7 で見つかりました)。
そして、ここに問題があります:
- ページのテキストを一度に 1 つずつ索引付けし、BookA の Page1 に用語 Term1 が含まれ、同じくBookAの Page2 に用語Term2が含まれている場合、検索Term1 AND Term2 では結果が得られません。これは正常です。
- すべてのページのテキストを 1 つの大きなテキスト ブロックにまとめ、すべてが同じ本に属している場合、見つかった用語が属するページを取得することはできません。
dtSearch デスクトップには、PDF のインデックス作成機能があります。1 つのドキュメントからすべてのページのテキストをインデックス化できますが、%%Page%% 記号を使用して、ヒットが発生したページを特定することもできます。
カスタム DataSource を使用してインデクサーにフィードしていますが、目的の結果を得るために使用するドキュメントの構造を特定できません。
他の fts エンジン (Lucene/Sphinx など) を使用している場合、上記の問題にどのように取り組みますか (同じことを繰り返すリスクがあります):
- ページのコンテンツをインデックスする必要があります
- ページはドキュメントに論理的にグループ化されます
- 書類による結果取得が必要
- ハイライト結果にはページ番号が含まれている必要があります
提案をありがとう、ジョージ
PS: 長文すみません