これが取り引きです。私はOCRテキストドキュメントを処理し、RegExを使用してそこからUPC情報を取得しています。その部分は私が理解しました。次に、データベースにクエリを実行し、その UPC の記録がない場合は、テキスト ドキュメントに戻って製品の説明を取得する必要があります。
領収書のフォーマットは次のとおりです。
NAME OF ITEM 123456789012
OTHER NAME 987654321098
NAME 567890123456
そのため、アイテムの名前を見つけるために2回目に戻ったとき、私は完全に途方に暮れています. UPC がある行にたどり着く方法は知っていますが、正規表現などを使用して UPC の前にある名前を取得するにはどうすればよいですか? または他の方法。どういうわけか行全体を保存してからPHPで解析することを考えていましたが、行を取得する方法もわかりません。
PHP を使用します。