解決したい:<tag>alphabetic characters and space</tag>
私はこれを提案します:
<.*>([A-Za-z]+)</.*>
これは正しいです?
貧しい開発者があなたの後にあなたのコードを処理しなければならないために、正規表現でXMLを解析しようとしないでください。
代わりにSAXまたはDOMパーサーを使用してください。あなたがグーグルで検索するならば、ウェブ上にたくさんの良いガイドがあります、しかしここに標準javax.xml
パッケージを使った簡単な例があります...
Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(xmlFile);
Node node = doc.getElementsByTagName("tag").item(0);
String value = node.getNodeValue();
入力が次の場合はどうなります<tag> something <inner-tag> some other thing </inner-tag> </tag>
か?
ApacheDigesterなどのXMLパーサーライブラリを使用することをお勧めします。
?
重複選択を除外するには文字を追加する必要があります
<.*?>[A-Za-z ]*</.*?>