OCRスキャン機能を備えたiPhoneアプリを開発しました。Tesseract api を使用して、撮影した画像からテキストを取得しました。しかし、名前、住所、電子メール、電話番号などに関して、各テキストを分離する必要があります。
ただし、1) "@" を含む文字列はほとんどが電子メール ID であると仮定するものはほとんどありません。2) 中括弧または + 記号を含むすべての数字は、ほとんどが電話番号になります..しかし、それでも多くの可能性があります。
NSLinguisticTaggerクラスの助けが必要になります。これが最善の策です。さもなければ、上記のように各部分に同様のロジックを作成する必要があります。