特定の文字列の最小かつ一意の左右の文字列を検出するメカニズムを探しています。次のテキストを検討してください。
<button id="allow" type="submit" class="button-big" name="allow" value="93db44648ab3607b10e600eaf796c794" tabindex="4">
value の値を取得する必要があります。したがって、選択することにした場合はsubstring
、name="allow" value="
左の文字列と"
右の文字列 (html データ全体の一意性に基づいて) とそれらの相対インデックスを使用します。w" value="
.
私の質問は、これを見つける方法ですか?ツールのソースがないため、検出できません。
上記の HTML コードは簡単に理解できるようにするための単なる例であるため、C# やその他の HTML ライブラリの HAP について私に提案しないでください。私は他の種類のデータを持っています。
C# や Java のスニペットであれば何でも構いません。
編集:私が処理しているデータは非html、非標準ですが、チームが説明したものです。また、その性質上、Java でコーディングする必要もあります。したがって、HtmlAgilityPack については考えられません。
一意のパターンを識別するためのすべての機能の可能性よりも、最小限の文字列を重視したいと思います。