Googleカレンダーのクイック追加ボタンと同様の方法で構造化されていないテキストを構造化することに関する参考文献(チュートリアル、本、学術文献)を探しています。
これが NLP のカテゴリに入る可能性があることは理解していますが、「リーバイス ジーンズ サイズ 32 A0b293」のようなものから移行するプロセスにのみ関心があります。
to: ブランド: リーバイス, サイズ: 32, カテゴリー: ジーンズ, コード: A0b293
字句解析と機械学習技術の組み合わせになると思います。
私はむしろ言語にとらわれませんが、押された場合は、python、Matlab、または C++ の参照を好むでしょう
ありがとう