@ChrisHaas が既に説明したように、コードと PDF のサンプルがなければ、特定するのは困難です。
まず第一に、iText(Sharp) は PDF 内の特定のテキストを検索するメソッドを直接公開していないため、実際には 0%を検索するため、 itextsharp が特定の単語の出現の約 50% を検索することができると言うのは少し誤解を招きます。テキスト抽出のフレームワークといくつかの簡単な例を提供するだけです。
このフレームワークを使用して特定の単語を真剣に検索するには、いくつかの呼び出しと組み合わせて、これらの単純なサンプルの使用法 ( および を使用するときに内部で動作する によって提供される) を適用するだけでは不十分です。必ず:SimpleTextExtractionStrategy
LocationTextExtractionStrategy,
PdfTextExtractor.GetTextFromPage(myReader, pageNum)
Contains(word)
さらに、@ChrisHaas が述べたように、テキスト内のスペースには特別な注意を払う必要があります。
これらの基準を念頭に置いて iText ベースのテキスト検索を作成すると、許容できるヒット率が確実に得られます。Adobe Reader は、すでにこの機能にかなりのリソースを投資しているため、Adobe Reader と同じくらいになるのはかなりの作業です。
完全を期すために、ページのコンテンツとそこから参照されるすべてのものを検索するだけでなく、かなりの量のテキスト コンテンツを含む可能性がある注釈も検索する必要があります。テキスト注釈。