特定のパラメーターの一致または欠落の重みを指定できるパターン認識アルゴリズムはありますか? たとえば、3 つの文字列があるとします。
str1 = Samsung 11.6" 64GB Slate PC Tablet with Wi-Fi - Black
str2 = Samsung Series 7 XE700T1A-A05US 11.6-Inch Slate (64 GB, Win 7 Pro)
str3 = Samsung Series 7 XE700T1A-A03US 11.6-Inch Slate (128 GB SSD, Win 7 HP)
従来の文字列距離では str2 が str3 に近いと言われますが、GB が等しいため、str2 を str1 に一致させたいと考えています。実際には、さまざまな重みを持つ多数のパラメーターを処理できるものを望んでいます。
正しい方向への指針をいただければ幸いです。