HTML ファイルがあり、その一部は次のようになります。
<a name="user_createtime"></a>
<p class="column">
<span class="coltitle">CreateTime</span> <span class="titleDesc"><span class='defPopupLink' onClick='popupDefinition(event, "datetime")'>datetime</span></span> <span class = "spaceandsize">(non-null)<sup><span class='glossaryLink' onclick="popupDefinition(event, '<b>non-null</b><br>The column cannot contain null values.')">?</span></sup></span>
<br>
<span class="desc">Timestamp when the object was created</span>
<a name="user_createuser"></a>
<p class="column">
<span class="coltitle">CreateUser</span> <span class="titleDesc">foreign key to <A HREF="User.html" TARGET="tableFrame">User</A></span>
<span class = "spaceandsize">(database column: CreateUserID)</span>
<br>
<span class="desc">User who created the object</span>
そのようなColtitleはたくさんあります。titleDesc および desc クラス。
ここで、「CreateTime」のような入力文字列を取得した場合、出力は次のようになります。
CreateTime, datetime, Timestamp when the object was created
入力文字列「CreateUser」を取得した場合、出力は次のようになります。
CreateUser, foreign key to User, User who created the object
私はこれに Jsoup を使用しています。
Elements colElements = Jsoup.parse(html).getElementsByClass("coltitle").select("*");
System.out.println("your Col:");
for (Element element : colElements)
{
if(element.ownText().equalsIgnoreCase("CreateTime"))
System.out.println(element.text());
}
選択したコルタイトルを印刷するだけです。関連するクラスを解析してその値を取得するにはどうすればよいですか? それとも、それらは関係がなく、間違った道を歩んでいるだけですか? 誰かが私の希望する出力を得るのを手伝ってもらえますか?