私は、Processing スケッチで HTML ファイルを解析しようとしている初心者のプログラマーです。(ちなみに、Processing を知らない場合は、Java にコンパイルされ、同じ正規表現関数を使用します)。SimpleML を使用して、HTML ファイルを単一の文字列として正しくキャプチャしました。キャプチャしようとしているデータは、次のようにテーブルから取得されます。
<th>Name</th>
<th>John F. Kennedy</th>
<th>Lyndon Johnson</th>
<th>Richard Nixon</th>
等
候補の名前を解析して配列に入れたい(「名前」を削除)。
だから私は最初に試しました
candidates = match(rawString,"<th>.*</th>");
リスト全体を返しました。
それから私は試しました
candidates = match(rawString,"<th>.{1,50}</th>");
のみを返します
<th>Name</th>
処理のドキュメントには次のように記載されています。
正規表現に (括弧のセットで指定された) グループがある場合、それぞれの内容が配列に返されます。正規表現一致の要素 [0] は一致する文字列全体を返し、一致グループは要素 [1] から始まります (最初のグループは [1]、2 番目のグループは [2] など)。
だから今、私は次のようなグループと量指定子のさまざまな組み合わせを試してきました:
candidates = match(rawString,"(<th>.{1,50}</th>)*");
しかし、何も機能していないため、私が得ていない概念的な部分があるに違いありません。これは簡単なはずですよね?