1

文字列/部分文字列の検索を高速化するために、大きな PDF ドキュメントからある種の「文字列カタログ」を作成する必要があります。

メカニズムは次のように動作するはずです。PDF スキャナーは PDF ドキュメントをスキャンして文字列を探し、カタログ内のコールバック メソッドを呼び出してその文字列にインデックスを付けます。

では、このようなカタログを作成するには、どのような手法を使用すればよいでしょうか? 聞いたことがあります: - サフィックス ツリー - 一般化されたサフィックス ツリー - サフィックス配列

私は主に一般化された接尾辞ツリーの傾向があります。私は正しいですか、それとも間違っていますか?「通常の」接尾辞ツリーは、単一の文字列のインデックス作成にのみ適していると思います。

しかし、サフィックス配列はどうでしょうか? 一般化されたサフィックス配列はありますか?

文字列からサフィックス ツリーを構築するための C/C++ のコードをたくさん見つけましたが、一般化されたサフィックス ツリーを構築するためのコードはありません!

4

0 に答える 0