巨大なテキストで検索する必要がある人物のフルネームの膨大なリストがあります。
名前の一部のみがテキストに表示される場合があります。また、スペルミス、ミスタイプ、または省略される可能性があります。テキストにはトークンがないため、テキストのどこから人名が始まるかわかりません。そして、名前がテキストに表示されるかどうかはわかりません。
例:
リストに「バラク・フセイン・オバマ」があるので、次のテキストでその名前が出現するかどうかを確認する必要があります。
- ...バラク・オバマ候補が合衆国大統領に選出された... (不完全)
- ...バラク・フセイン候補が米国大統領に選出された... (不完全)
- …バラク・ホー候補がアメリカ合衆国大統領に選出された…(省略)
- …バラク・オバナ候補が合衆国大統領に選出された…(つづり間違い)
- ...バラク・オバマ候補がアメリカ合衆国大統領に選出された... (タイプミス、B は V の隣)
- ...ジョン・マケイン候補は選挙に敗れた... (オバマの名前は出てこない)
確かに決定論的な解決策はありませんが...
この種の検索に適したヒューリスティックは何ですか?
しなければならない場合、どのようにしますか?