何千もの古い文書をスキャンし、重要なデータをデータベースに入力しました。フィールドの 1 つは著者名です。
特定の著者による文書を検索する必要がありますが、多くの文書ではデータが手書きであるため、正確な名前が間違って入力されている可能性があります。
姓の最初の数文字だけを検索して、ユーザーが選択できるリストを表示することを考えました。現段階では、明確な著者が何人いるかはわかりませんが、数十万人ではなく数百人になると思います。何十万ものドキュメントがあります。より良い方法はありますか?SQL データベースの方がうまく処理できるでしょうか?
ソフトウェアは python であり、作成者ごとにドキュメントのリストが表示されます。