“full-text-indexing”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1027 参照

postgresql - PostgreSQL : Gin の最大フィールドサイズ

私は現在、多くの FullText インデックス作成ソリューションを評価しており、ネイティブの postgres FT で遊んでいます。

GIN インデックスを使用してデータのインデックスを作成しようとしています。しかし、フィールドサイズには制限があり、データの挿入中に「巨大なタプル」というエラーが発生します。

私が理解している限り、それはフィールドサイズに直接関係しています。しかし、この制限は私が見つけたどのドキュメントにも書かれていないので、誰かがこの制限を知っていますか?それを変更する方法があれば?

ありがとう

PS : postgresql のソースコードでこの定義を見つけました ((BLCKSZ - SizeOfPageHeaderData - \ MAXALIGN(sizeof(GinPageOpaqueData))) / 3 - sizeof(ItemIdData)) 。

user155118

2009-09-14T10:01:50.237

0 投票する

1 に答える

1856 参照

sql - SQLフリーテキストなど

'％fish％'のように使用すると、次のようになります。

水族の金魚のフレーク

しかし、Contains（[Description]、'"fish *"'）を使用すると、何かできることはありませんか？

基本的には、魚という言葉が含まれているものはどこにでも返却したいと思います。

sql sql-server sql-server-2005 full-text-indexing

2009-10-23T14:18:25.893

0 投票する

2 に答える

1925 参照

c# - 共有ホスティング上の Lucene.NET

共有ホスティング環境で Lucene.NET を動作させようとしています。codeproject の Mascix は、godaddyでこれを動作させる方法をここで概説しています。私はisqsolutionsでこれを試みています。

彼が投稿した両方の例は、私のローカルマシンで正常に動作し、共有ホスティングサーバーで同じエラーをスローします。

次のように、web.config に Lucene.NET アセンブリへの直接参照を追加してみました。

しかし、これも独自のエラーをスローします。私の質問は次のとおりだと思います:単純なものが不足していますか、それともサーバー側の設定によりこれがまったく機能しなくなる可能性がありますか?

c#full-text-search lucene.net shared-hosting full-text-indexing

2009-11-10T13:39:37.133

0 投票する

1 に答える

482 参照

mysql - MySql フルテキストインデックスを表示するにはどうすればよいですか?

MySql 全文検索はインデックス作成を使用しますか?
その場合、インデックスエントリテーブルを表示するにはどうすればよいですか?

VIEW クエリでインデックス統計を表示できます。しかし、インデックスレコードエントリテーブルを表示したかっただけです。

mysql indexing full-text-indexing

2009-11-26T05:33:30.680

0 投票する

1 に答える

1451 参照

sql - HTML/XMLデータのSQL全文検索

cmsデータベース（SQL 2005）にSQLフルテキストカタログがあります。データベースは、全文カタログの一部であるntext列内にCMSページのコンテンツを保持します。予想どおり、検索ではページコンテンツ内のxmlタグが考慮されるため、「H1」を検索すると、H1タグが付いたすべてのページが返されます。

全文検索内のフィルターを適用して、xmlタグ内のデータのみにインデックスを付けることは可能ですか？

SQL全文検索で.htmlバイナリタイプまたはxml列のインデックス作成/検索が可能であることがわかります。ただし、ご覧のとおり、セットアップはこれとは少し異なります。

どうもありがとう、

アダム

sql sql-server sql-server-2005 full-text-search full-text-indexing

2009-12-10T10:13:10.620

0 投票する

2 に答える

584 参照

words - 多くの記事の単語リスト - 用語マトリックス

トルコ語で約 15 万の記事があります。自然言語処理の研究に記事を使用します。記事を処理した後、記事ごとに単語とその頻度を保存したい。

現在RDBSに保存しています。

私は3つのテーブルを持っています:

Articles -> article_id,text
Words -> word_id, type, word
Words-Article -> id, word_id, article_id, frequency (word_id のインデックス、 article_id のインデックス)

問い合わせます

記事内のすべての単語
記事ごとに 1 つの単語の頻度
すべての記事およびどの記事での単語の出現

words-article テーブルに何百万もの行があります。このプロジェクトでは常に RDBS を使用していました。mysql から始めて、現在は oracle を使用しています。しかし、私は oracle を使用したくなく、mysql よりも優れたパフォーマンスが必要です。

また、4 GB RAM を搭載したマシンでこのジョブを処理する必要があります。
簡単に言えば、文書と用語のマトリックスを保存し、それに対してクエリを実行する方法は? 性能が必要です。「キー値データベース」はパフォーマンスでmysqlを打ち負かすことができますか? または、mysql に勝るものは何ですか?

あなたの答えのプログラミング言語が依存している場合、私はpythonでコードを書いています。ただし、C/C++ 、Java は問題ありません。

words full-text-indexing text-analysis frequency-analysis

2009-12-25T02:23:33.530

0 投票する

5 に答える

3245 参照

java - Google App Engine に最適な Java テキストインデックスライブラリはどれですか?

現時点では、コンパスがこの作業を処理できることを知っています。しかし、コンパスを使用したインデックス作成はかなり高価に見えます。より軽い代替品はありますか？

java google-app-engine full-text-indexing

2010-01-03T18:32:51.420

0 投票する

1 に答える

499 参照

full-text-indexing - Lemur がファイルのインデックスを作成しようとすると、ドキュメントの形式が正しくないというエラーが表示される

ここでキツネザルのインデックス作成チュートリアルを少し行ってきました。

http://www.lemurproject.org/tutorials/begin_indexing-1.php

一見適切にフォーマットされたファイルを含む 1 つのドキュメントを含む "コーパス" フォルダーを作成しました。

次の構成ファイルを作成しました。

ただし、実行すると:

不可解な例外が発生します。

ソース内の関連する関数を見ましたが、特に何も飛び出していません。何か案は？

full-text-indexing

2010-02-20T04:52:37.247

0 投票する

1 に答える

84 参照

sql-server - SQL Server で全文索引を使用すると、パフォーマンスが向上しますか? どこでも、またはいくつかの状況で？

NHibernate ORM を使用して大きなアプリケーションを作成します。DB レベルで全文索引付けを使用すると、アプリケーションのパフォーマンスに利点がありますか? 検索のパフォーマンスが向上しますか?

sql-server performance nhibernate full-text-indexing

2010-02-28T07:06:02.980

0 投票する

1 に答える

538 参照

sql-server - SQLServerのitemcountプロパティは何と一致する必要がありますか

itemcountプロパティがインデックス付けされた行の数と正確に一致しない場合、それは問題ですか？完全なフルテキストインデックスがあることを確認できる数値的な方法はありますか？

更新：プロパティfulltextcatalogproperty('database','itemcount')は、インデックス付きテーブルの行数と等しくありません。数千ずれています。これは、インデックスに情報が不足していることを示していますか、それともitemcountが完全に一致しないと予想しますか？

sql-server sql-server-2000 full-text-indexing

2010-03-05T22:24:22.050

問題タブ [full-text-indexing]

Reference