この生成されたファイルの例で、私が制御できないほど多くのスペースを含む番号 3433 を選択できますか?
BIOLOGIQUES 3433 130906 / 3842
こちらの例をご覧ください: http://regexr.com?368ku
番号 3343 はファイルごとに変わる可能性がありますが、常に同じ位置になります/
私はphpで正規表現を使用しています。
xpdfのpdftotext関数で変換するのはpdfドキュメントなので、pdfから別の数値に変更する必要があります。
配置が非常に悪く、正規表現でキャプチャする方法がわかりません。
私は試した:
BIOLOGIQUES [^0-9]*\K([0-9]*)(.*)
http://regexr.com?368ku しかし、すべての数字が必要です。最初の数字だけが必要です。