テキスト (実際にはたくさんのテキスト) がある場合、どこかに 1 つの ISBN が含まれているので、それを見つけなければなりません。
私の ISBN-13 は「978」で始まり、その後に 10 桁が続きます。
私は知りません:「-」(マイナス)がいくつあり、それらが正しい場所にあるかどうか。
私のコードは、マイナスのない ISBN のみを見つけます。
regex=r'978[0-9]{10}'
pattern = re.compile(regex, re.UNICODE)
for match in pattern.findall(mytext):
print(match)
しかし、次のような ISBN を見つけるにはどうすればよいですか。
- 978-123-456-789-0
- 978-1234-567890
- 9781234567890
- 等...
これは1つの正規表現パターンで可能ですか?
ありがとう!