次のような約2000行を含むファイルがあります。
<nobr> <a href="../Carbon_Monoxide_Poisoning_Prevention.htm"><b>poisoning - prevention</b></a></nobr><br>
<nobr> <a href="../Carbon_Monoxide_Symptoms.htm"><b>symptoms</b></a></nobr><br>
1.) URL は常に次の形式です。../foo.html
<b> ... </b>
2.) 表示名がタグで囲まれている場合とそうでない場合があります。
3.) ファイルの各行には最大 4 つ含まれており
、スペースとして数えてフラグを立てる必要があります。これらは最終的にインデントをフォーマットするために使用されるため、何らかの方法で情報を取得する必要があります。
次のように、区切られたフラット ファイルにハイパーリンク、表示名、およびスペース名の数が必要です (上記のデータに基づく)。
../Carbon_Monoxide_Poisoning_Prevention.htm,poisoning - prevention,4
../Carbon_Monoxide_Symptoms.htm,symptoms,4
. これは、文字列、部分文字列、および if ステートメントの混乱全体を通して解析できますが、必要以上に面倒なようです。私は正規表現を調査していましたが(初めて調査しました)、構文の一部が少し不明です。自分のアプリケーションに似たコード サンプルを見るのが最もよくわかりますが、完全に適合する例を見つけることができませんでした。
どんな助けでも大歓迎です!