構造がまったく予測できない小さな文字列からプログラムのタイトルを抽出しなければならないという問題に直面しています。以下に示すようなパターンがいくつかあります。タイトルを正しく取得できるようにするには、各文字列を評価して、それらの構造のいずれかに一致するかどうかを確認する必要があります。
正規表現の習得を購入しましたが、これを達成するために必要な時間では、本を勉強して、この(興味深いが特定の)テーマの必要な紹介を取得しようとすることができません。
Perharps、この分野で経験を積んだ誰かが、この仕事を成し遂げる方法を理解するのを手伝ってくれるでしょうか?
Some random Name 2 - Ep.1
=> Some random Name 2
Some random Name - Ep.1
=> Some random Name
Boff another 2 name! - Ep. 228
=> Boff another 2 name!
Another one & the rest - T1 Ep. 2
=>Another one & the rest
T5 - Ep. 2 Another Name
=> Another Name
T3 - Ep. 3 - One More with an Hyfen
=> One More with an Hyfen
Another one this time with a Date - 02/12/2012
=>Another one this time with a Date
10 Aug 2012 - Some Other 2 - Ep. 2
=> Some Other 2
Ep. 93 - Some program name
=> Some Program name
Someother random name - Epis. 1 e 2
=> Someother random name
The Last one with something inside parenthesis (V.O.)
=> The Last one with something inside parenthesis
ご覧のとおり、指定された文字列から抽出したいタイトルには、数字、&などの特殊文字、およびa-zA-Zの文字が含まれている可能性があります(これですべてだと思います)
複雑な部分は、タイトルの後に1つ以上のスペースがあり、その後にハイフンが続くかどうか、およびEpまで0以上のスペースがあるかどうかを知る必要がある場合に発生します。(私はこれを説明することはできません、それはただ複雑です。)