多くの見出しから見出しレベル (レベル 1、レベル 2、レベル 3) にタグを付けようとしています。HTML からのフォント サイズ情報を使用します。最初に、次のような正規表現を使用してフォントサイズを取得しました
"<span style=\"font-family:\'(.+?)\'"->1=fontfamily;
"<span style=\"font-family(.+?)font-size:\'(.+?)\'"->2=font size;
ここで、フォントサイズ情報とそれに基づくタグ見出しレベルを使用して、これらすべての見出しサイズを比較する必要があります。
入力:
<span style="font-family:'Times New Roman'; font-size:'14pt'"><span class="">MATERIALS AND METHODS</span></span>
<span style="font-family:'Times New Roman'; font-size:'12pt'"><span class="">Chemicals</span></span>
<span style="font-family:'Times New Roman'; font-size:'10pt'"><span class="">HILIC-MS Profiling of Metabolites</span>