IP:PORT のリストが html にあり、findall を使用してすべての IP を検索すると、IP が一意であるため、すべての IP のリストが取得されます。一部のポートは同じであり、100 個の IP と 87 個のポートのみのリストを例として取得します。繰り返しポートを持つすべてのポートを見つける方法は?
proxies = re.findall("[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}",html)
ports = re.findall("[0-9]{1,3}\,[0-9]{1,3}\,[0-9]{1,3}\,[0-9]{1,3}",html)
#ports are coded to looks like this 47,46,47,46
print len(proxies)
print len(ports)