2

辞書のキーの値を利用する関数があります。値はリストであり、そのリストを繰り返し処理してサンプル文字列と比較します。

for item in List1: #iterate over objects of list
    [l3,l4] = dict2[item] #this just assigns float values to l3,l4 (not needed)
    if ((distance(l1,l2,l3,l4)<200)and(difflib.SequenceMatcher(None, str1, item).ratio()>0.7)):  #error here , 
        str2 = item

distanceは、4 つの float 値 l1、l2、l3、l4 の入力に対して float 値を返す関数です。それは問題ではありません。問題はdifflib.SequenceMatcher(None, str1, item).ratio().

エラーは次のとおりです。

 TypeError                                 Traceback (most recent call last)
<ipython-input-27-441e1aa01c23> in <module>()
----> 1 BLR_data_test['modified_buildings'] = BLR_data_test['extracted_building'].apply(modify_building)

C:\Anaconda\lib\site-packages\pandas\core\series.pyc in apply(self, func, convert_dtype, args, **kwds)
   2021             values = lib.map_infer(values, lib.Timestamp)
   2022 
-> 2023         mapped = lib.map_infer(values, f, convert=convert_dtype)
   2024         if len(mapped) and isinstance(mapped[0], Series):
   2025             from pandas.core.frame import DataFrame

C:\Anaconda\lib\site-packages\pandas\lib.pyd in pandas.lib.map_infer (pandas\lib.c:44780)()

<ipython-input-26-f11f38a90e26> in modify_building(str1)
      5     for item in List1:
      6         [l3,l4] = dict2[item]
----> 7         if ((distance(l1,l2,l3,l4)<200)and(difflib.SequenceMatcher(None, str1, item).ratio()>0.7)):
      8             str2 = item
      9             break

C:\Anaconda\lib\difflib.pyc in ratio(self)
    657 
    658         matches = reduce(lambda sum, triple: sum + triple[-1],
--> 659                          self.get_matching_blocks(), 0)
    660         return _calculate_ratio(matches, len(self.a) + len(self.b))
    661 

C:\Anaconda\lib\difflib.pyc in get_matching_blocks(self)
    479         if self.matching_blocks is not None:
    480             return self.matching_blocks
--> 481         la, lb = len(self.a), len(self.b)
    482 
    483         # This is most naturally expressed as a recursive algorithm, but

TypeError: object of type 'float' has no len() 

Str1 は string であり、それを と比較しitemます。itemは文字列のリストであることに注意してください。docs に従って、difflib 引数はハッシュ可能である必要がありitem、一意のハッシュ値はありません。どうすればこれを回避できますか??

4

1 に答える 1