0

URLのリストを取得し、URLの最初の文字に基づいてファイルに保存する機能があります。まず、http:// を削除し、最初の文字をフィルター処理し、その最初の文字をファイル拡張子と結合し、そのファイルを細かく指定して、URL がファイルに存在するかどうかを検索し、存在しない場合はスキップし、ファイルに書き込み、diff_url_list に追加します。ソースコードです

def checkDiffUrls(url_list):
import mmap
diff_url_list=[]
file_extension="txt"
for urls in url_list:
     temp_url=urls.replace("http://","")
     url_head=temp_url[0][0]
     path=".".join((url_head,file_extension))
     file=open("urls/"+path,'w')
     file_read = mmap.mmap(file.fileno(), 0, access=mmap.ACCESS_READ)
     if urls not in file_read:
         file.write(urls)
         diff_url_list.append(urls)
     file.close()

return diff_url_list

エラーが表示されます mmap length is greater than file size 誰かそのバグを修正できますか? ありがとうございました。感謝します。

4

0 に答える 0