さまざまな命名スキームを持つオーディオ ファイル名のリスト (番号が続く文字列のリストである可能性があります) があるとしますが、それらのすべてにファイル名にトラック番号が含まれています。
変化する数字を抽出したい。
例 1
Fooband 41 - Live - 1. Foo Title
...
Fooband 41 - Live - 11. Another Foo Title
望ましい結果
番号のリスト:1,2,3,...,11
例 2
02. Barband - Foo Title with a 4 in it
05. Barband - Another Foo Title
03. Barband - Bar Title
...
17. Barband - Yet another Foo Title
望ましい結果
番号のリスト:2,5,3,...,17
インデックス番号の位置が固定されていないので、正規表現が使えない(と思う)。
私が持っているもの
- 文字列の共通のプレフィックスとサフィックスを見つけて、それを切り取ります
- 文字列の左側/右側に数字があるかどうかを確認する
- その数を使用してインデックスを取得します
しかし、問題があります: Example 1の一般的なプレフィックスを見つけた場合、一般的なプレフィックスは になる
Fooband 41 - Live - 1
ため、1
失われます (同様にSong X - 10, Song X - 11, ...)
.
質問
文字列のリストで変化する番号 (同様の位置にある) を検出して抽出する良い方法は何ですか?
私はPythonを使用しています(この問題には関係ありません)
ローマ数字も検出できればおまけですが、それはもっと難しいと思います。