1

次のhtml文字列があります: <a href="http://www.nndc.bnl.gov/nsr/fastsrch_act2.jsp?aname=F.V.Adamian">F.V.Adamian</a>, <ahref="http://www.nndc.bnl.gov/nsr/fastsrch_act2.jsp?aname=G.G.Akopian">G.G.Akopian</a>

著者名を含む 1 つのプレーン テキスト文字列を作成して、次のようにしたいと考えています (句読点は後で微調整できます)。

FVAdamian、GGAkopian。

Matlab で「regexp」を使用しようとしています。私が次のことをするとき: regexpi(htmlstring,'">.*</a>','match')

私は得る:

">F.V.Adamian</a>, <a href="http://www.nndc.bnl.gov/nsr/fastsrch_act2.jsp?aname=G.G.Akopian">G.G.Akopian</a>,

なんで?私はそれを継続的に出力しようとしています (したがって、「一度」演算子は使用しませんでした) "> と の間のすべての文字 (著者名) です。最初の文字では正常に機能しますが、2 番目の文字では機能しません。私は"> を切り捨てて、後で regexprep(regexpstring,'','') を使用してください。

私はそれがregexprep(htmlstr, '<.*?>','')機能し、私が望むことをするのを見ます。しかし、私はそれを理解していません...

4

1 に答える 1