ここに同様の「2つの正規表現を組み合わせる」投稿がたくさんあることは知っていますが、解決策を試してみましたが、エラーが発生し続けています。
次のような説明を解析するための正規表現があります。
Org Biomol Chem. 2011 May 7;9(9):3549-59. doi: 10.1039/c1ob05128h. Epub 2011 Mar 28.
DOI (デジタル オブジェクト識別子) を抽出するには:
([^:]+$)
--> 10.1039/c1ob05128h. Epub 2011 年 3 月 28 日。([^\s]+)
--> 10.1039/c1ob05128h.
しかし、これらを組み合わせる方法についてはかなり無知です。難しい場合は必要ありませんが、計算が簡単になります。
また、最後の「。」を取り除く方法もわかりません。これは DOI 文字列の一部ではありません (記録としては、DOI に 2 つ以上のピリオドが存在する可能性があるため、正規表現は単に「2 番目のピリオドの後」になることはできません)。
要求されたその他の例:
Chem Soc Rev. 2008 Nov;37(11):2413-21. doi: 10.1039/b719548f. Epub 2008 Sep 16.
Small. 2010 Dec 20;6(24):2796-820. doi: 10.1002/smll.201001881. Review.
Org Lett. 2010 Oct 1;12(19):4248-51. doi: 10.1021/ol101920b.
Chemistry. 2010 Dec 27;16(48):14285-9. doi: 10.1002/chem.201002111. No abstract available.
これまでに行ったすべての試みは、これとほぼ同じ結果をもたらします。
理由は不明ですが、「doi: ([^\s]+).? ([^:]+).?」というデューケリングの提案に対する例外のいくつかは次のとおりです。
- Chem Commun (カム)。2012 年 12 月 25 日;48(99):12094-6。ドイ: 10.1039/c2cc35588d.
- Org Biomol Chem。2013 年 1 月 7 日;11(1):27-30。ドイ: 10.1039/c2ob26587g.
- Chem Commun (カム)。2013 年 1 月 25 日;49(7):671-3。ドイ: 10.1039/c2cc37953h.
- オルグレット。2010 年 10 月 1 日;12(19):4248-51。doi: 10.1021/ol101920b.化学。2010 年 7 月 26 日;16(28):8537-44。ドイ: 10.1002/chem.201000773.
- Chem Commun (カム)。2012 年 12 月 25 日;48(99):12094-6。ドイ: 10.1039/c2cc35588d.
- Org Biomol Chem。2013 年 1 月 7 日;11(1):27-30。ドイ: 10.1039/c2ob26587g.
- Chem Commun (カム)。2013 年 1 月 25 日;49(7):671-3。ドイ: 10.1039/c2cc37953h.
- オルグレット。2010 年 10 月 1 日;12(19):4248-51。ドイ: 10.1021/ol101920b.
- 化学。2010 年 7 月 26 日;16(28):8537-44。ドイ: 10.1002/chem.201000773.