3

次のコードを検討してください。

for url in urls:
        obj           = HtmlInfo()

        obj.url       = url 
        obj.html      = hc.get_html(url)
        obj.tag_count = hc.get_num_tags(obj.html, 0, True)
        htmlinfos.append(obj)

whereurlsは URL のリストでありhtmlinfos、ループの前に次のように空のリストに初期化されます。

htmlinfos = [ ]

しかし、何らかの理由で、list-assignment index out of rangeこのコードを実行しようとすると例外が発生します。

これには何が問題になる可能性がありますか?私のPythonバージョンは2.7で、Djangoの最新の安定バージョン(1.4だと思います)を使用していることに注意してください

更新 - トレースバック

Environment:


Request Method: GET
Request URL: http://xx.xxx.xxx.xx/xxx/0/test/

Django Version: 1.4.1
Python Version: 2.7.3
Installed Applications:
('django.contrib.auth',
 'django.contrib.contenttypes',
 'django.contrib.sessions',
 'django.contrib.sites',
 'django.contrib.messages',
 'django.contrib.staticfiles',
 'django.contrib.admin',
 'scrapper',
 'django_pdb')
Installed Middleware:
('django.middleware.cache.UpdateCacheMiddleware',
 'django.middleware.common.CommonMiddleware',
 'django.contrib.sessions.middleware.SessionMiddleware',
 'django.middleware.csrf.CsrfViewMiddleware',
 'django.contrib.auth.middleware.AuthenticationMiddleware',
 'django.contrib.messages.middleware.MessageMiddleware',
 'django_pdb.middleware.PdbMiddleware')


Traceback:
File "/usr/local/lib/python2.7/dist-packages/django/core/handlers/base.py" in get_response
  111.                         response = callback(request, *callback_args, **callback_kwargs)
File "/usr/share/nginx/www/xxx/private/xxx/views.py" in test
  44.         return HttpResponse("Dis be er bad query yo " + test_id )
File "/usr/share/nginx/www/xxx/private/xxx/views.py" in __get_html_list
  23.     return list

Exception Type: IndexError at /xxx/0/test/
Exception Value: list assignment index out of range

更新 - __get_html_list()

def __get_html_list():
    hc = HtmlCounter()

    htmlinfos = [ ]

    #add more urls here for testing
    urls = [ '/usr/share/nginx/www/xxx/private/template/test/html_count_test.html' ]


    for url in urls:
        obj           = HtmlInfo()

        obj.url       = url 
        obj.html      = hc.get_html(url)
        obj.tag_count = hc.get_num_tags(obj.html)
        htmlinfos.append(obj)

    return htmlinfos

ノート

もともとhtmlinfosは単に として知られていlistたので、これを投稿する前に変更し、再実行しましたが、まだ同じエラーが発生しています:/

更新 - get_html_tag_count()

簡潔にするために、これが問題に関連している可能性がある場合に備えて、これも投稿することをお勧めします。

def get_num_tags(self, html):

        if reset:
            self.reset()

        current_index = 0

        for char in html:

            if (char == "<"):

                close_index = html[current_index:].find("/>", current_index)

                if close_index == -1:
                    break
                else:
                    ++self._tag_count

            ++current_index

        return self._tag_count
4

1 に答える 1

2

++self._tag_count++current_indexをそれぞれself._tag_count+=1とに置き換えてみてくださいcurrent_index+=1

++varほとんどの言語で動作しますが、Pythonはほとんどの言語とは異なります。

于 2012-08-08T19:18:16.500 に答える