ここに、属性値のフェッチを担当するコードがあります。
currPost.Body = reader.getAttributeValue("", "Body");
だから、Body
まさに私の問題が基づいている属性です。
XML ファイルは SQL Server ダンプを表し、次のような形式になっています。
<?xml version="1.0" encoding="utf-8"?>
<posts>
<row Id="1" PostTypeId="1" AcceptedAnswerId="65" CreationDate="2011-05-24T19:28:37.853" Score="13" ViewCount="964" Body="<p>Sehr viele Märchen beginnen auf Deutsch mit "Es war einmal", aber ich kenne auch ein Märchen, das anfängt mit "Zu der Zeit, als das Wünschen noch geholfen hat ...".</p>

<p>Gibt es noch andere Beginnformeln und wenn ja, kann man diese dem geographischen Ursprung der Märchen zuordnen?</p>

<blockquote>
 <p>Many German fairy tales open with
 "Es war einmal", but some start with
 "Zu der Zeit, als das Wünschen noch
 geholfen hat ...".</p>
 
 <p>Are there any other common
 introductions? If so, is there a correlation between their use and the geographic origin of the story?</p>
</blockquote>
" OwnerUserId="4" LastEditorUserId="2" LastEditDate="2011-05-25T05:39:54.580" LastActivityDate="2011-05-25T11:56:08.270" Title="Gibt es andere übliche Märchenbeginnformeln neben "es war einmal"?" Tags="<regional>" AnswerCount="2" CommentCount="2" FavoriteCount="4" />
問題自体は、「ボディ」値を取得すると、多くの文字/記号が欠落している短縮された文字列が常に取得されることです。
値を見てくださいBody
。それは
Body="<p>Sehr viele Märchen beginnen auf Deutsch mit "Es war einmal", aber ich kenne auch ein Märchen, das anfängt mit "Zu der Zeit, als das Wünschen noch geholfen hat ...".</p>

<p>Gibt es noch andere Beginnformeln und wenn ja, kann man diese dem geographischen Ursprung der Märchen zuordnen?</p>

<blockquote>
 <p>Many German fairy tales open with
 "Es war einmal", but some start with
 "Zu der Zeit, als das Wünschen noch
 geholfen hat ...".</p>
 
 <p>Are there any other common
 introductions? If so, is there a correlation between their use and the geographic origin of the story?</p>
</blockquote>
"
だから、私がちょうど印刷すると、System.out.println()
これだけが得られます
<p>Sehr viele Märchen beginnen auf Deutsch mit "Es war einmal", aber ich kenne auch ein Märchen, das anfängt mit "Zu der Zeit, als das Wünschen noch geholfen hat ...".</p>
ご覧のとおり、Body
値には html タグが含まれています。これが問題になる可能性はありますか?そして、どうすればいいですか?
それとも、他の解決策がありますか?
どうもありがとう!