私はサイトのいくつかのアイテムをスクレイピングしており、これを応答として取得しています:
<a href="t-1956883.html">Oh my gooood <span class="smalltext">403 readers</span></a>
t-1956883.html
ここで、href を からに変更したいと思いhttp://www.somemagicsite.com/t1956883
ます。
これは私が取得した現在の正規表現です。t-[0-9]*.html
しかし、結果を一致させるだけでなく、結果を除外する方法がわかりません。