私は経験と知識のための検索エンジンを書いているところです。現在、クローラーとそれに付随するユーティリティを作成中です。これらの 1 つが URL ノーマライザーです。これは私が今構築しようとしているものであり、より具体的には、URL を取得し、「%」記号に続く文字を大文字にする方法を作成する必要がある時点で立ち往生しています。これまでの私のコード:
def escape_sequence_capitalization(url):
''' The method that capitalizes letters in escape sequences.
All letters within a percent - encoding triplet (e.g. '%2C') are case
insensitive and should be capitalized.
'''
next_encounter = None
url_list = []
while True:
next_encounter = url.find('%')
if next_encounter == -1:
break
for letter in url[:next_encounter]:
url_list.append(letter)
new_character = url[next_encounter + 1].upper()
url_list.append(new_character)
url = url[next_encounter:]
for letter in url:
url_list.append(letter)
return ''.join(url_list)
誰かが私のエラーがどこにあるのか教えてもらえますか? 私は感謝されます。ありがとうございました。
編集:これは私が達成しようとしているものです:
http://www.example.com/a%c2%b1b → http://www.example.com/a%C2%B1b