0

以下は、rfc822、rfc2822、および MIME で定義されたサンプル ヘッダーです。今度は、lucene を使用して全文検索を作成したいと考えています。標準のアナライザーを使用すると、パフォーマンスを低下させる無駄なトークンが大量に作成されます。カスタム アナライザーとトークナイザーを作成して、適切なトークンを作成する方法はありますか。

webmaster@email.marketingmag.ca から

Microsoft メール インターネット ヘッダー バージョン 2.0

受信: mpc-exchange.medicis.com による sdlasd02.medicis.com ([172.23.163.35]) から

Microsoft SMTPSVC (6.0.3790.3959); 2009 年 6 月 1 日月曜日 04:30:59 -0700

受信: Microsoft SMTPSVC を使用した sdlasd02.medicis.com によるメール ピックアップ サービスから。2009 年 6 月 1 日月曜日 04:30:59 -0700

受信: Microsoft SMTPSVC (6.0.3790.1830) を使用する sdlasd02.medicis.com による SDLMAIL01.medicis.com ([98.175.1.32]) から。2009 年 6 月 1 日月曜日 04:30:59 -0700

リターンパス: bo-buhbpmfbpgh9f6axbzpa2ae1achzvh@b.email.marketingmag.ca

X-CTCH-ID: CFBA793F-FB3C-4DEB-A504-C6165B493680

X-CTCH-RefID: str=0001.0A090202.4A23BBF3.009A,ss=1,fgs=0

X-CTCH-アクション: 無視

4

1 に答える 1

0

通常、維持したいヘッダー (Date、Message-ID、From: など) ごとに 1 つのフィールドを追加し、残りは無視します。各フィールドは関連するタイプであり、それに応じて分析されます

于 2012-10-17T07:22:19.527 に答える