この形式の文字列のHTMLファイルを解析しようとしています。
<a href="/userinfo/userinfo.aspx?ID=305157" target="main">MyUsername</a> O22</td>
「305157」、「MyUsername」、および「O22」の最初の文字(T、K、またはOのいずれか)の情報を取得したいと思います。
私はこの正規表現を使用しています。<a href="/userinfo/userinfo\.aspx\?ID=\d*" target="helgonmain">\w*</a> \w\d\d
「\w」がある場所にåäöÅÄÖがない限り、問題なく動作します。
私は何をすべきか?