4

これらのフォーラムに初めて書き込みます。しかし、長い間それらを読んでいます。

.Net で XmlReader を使用して Xml ファイルを検証しようとすると、問題が発生します。

XML ファイル:

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE root [
  <!NOTATION png PUBLIC "-//W3C//NOTATION Portable Network Graphics//EN">
  <!ENTITY mypic SYSTEM "mypic.png" NDATA png>
]>
<root>
  <img ref="mypic" />
</root>

Xsd ファイル:

<?xml version="1.0" encoding="utf-8"?>
<xs:schema id="myschema"
    elementFormDefault="qualified"
    xmlns:xs="http://www.w3.org/2001/XMLSchema">
  <xs:element name="img">
    <xs:complexType>
      <xs:attribute name="ref" type="xs:ENTITY" />
    </xs:complexType>
  </xs:element>

  <xs:element name="root">
    <xs:complexType>
      <xs:sequence>
        <xs:element ref="img" />
      </xs:sequence>
    </xs:complexType>
  </xs:element>
</xs:schema>

C# スニペット:

XmlReaderSettings settings = new XmlReaderSettings();
settings.ValidationEventHandler += settings_ValidationEventHandler;
settings.ValidationType = ValidationType.Schema;
settings.DtdProcessing = DtdProcessing.Parse;
settings.ValidationFlags |= XmlSchemaValidationFlags.ProcessIdentityConstraints
            | XmlSchemaValidationFlags.ProcessInlineSchema
            | XmlSchemaValidationFlags.ProcessSchemaLocation
            | XmlSchemaValidationFlags.ReportValidationWarnings;

using (XmlReader reader = XmlReader.Create("myschema.xsd")) 
{
    settings.Schemas.Add(XmlSchema.Read(reader, new ValidationEventHandler(settings_ValidationEventHandler)));
}

using (XmlReader reader = XmlReader.Create("mydata.xml", settings))
{
    while (reader.Read()) ;
}

次のような検証エラーが表示されます。

Reference to an unparsed entity, 'mypic'.

他のバリデータによると、検証は行いますが、XmlReader によるとはしません。

考えられることはすべて試したので、今は皆さんに頼っています。どんな助けでも大歓迎です。

4

1 に答える 1

3

Reflector を使用することで、NOTATION および ENTITY 宣言が実際に適切に解析されることがわかりました。

バリデーターはエンティティー参照を見つけ、mypic空でない NDATA 宣言があるため、それを外部で解析されていないと見なします。

ただし、バリデーターは、解析されていないエンティティ参照に遭遇するたびに、解析されていないエンティティへの参照エラーを常に送信することも発見しました。

Microsoft がこれをエラーとして報告している理由がわかりません。私の意見では、バリデータは解析されていないエンティティ参照を無視するか、エラーではなく警告として報告する必要があります。

もちろん、他のエラーが報告されない限り、バリデーターからのこれらのエラーを無視して、XML が有効であると見なしても安全です。

では、報告されたエラーが無視できる、解析されていないエンティティへの参照エラーであるかどうかを判断するにはどうすればよいでしょうか?

次の 3 つのオプションが表示されます。

  1. エラー メッセージが文字列 で始まるかどうかを確認しますReference to an unparsed entity。コードが英語以外のプラットフォームで実行されると、これは機能しなくなります。

  2. リフレクションを使用して内部GetResプロパティの値を取得し、それが と等しいかどうかを確認しSch_UnparsedEntityRefます。Microsoft が内部 API を変更することを決定した場合、これは壊れます。

  3. 例外をシリアル化し、シリアル化されたresメンバーが と等しいかどうかを判断しSch_UnparsedEntityRefます。Microsoft がシリアル化形式を変更することを決定した場合、これは壊れます。

これらのオプションはすべて「ハック」です。一番壊れやすいのは1枚目。ただし、3 つ目は安全なはずです。他のコードとの互換性を損なう可能性があるため、Microsoft がシリアル化形式を変更する可能性は低いです。

メソッドで受け取った検証例外を無視するかどうかを判断する方法の例を次に示しますsettings_ValidationEventHandler

エラーメッセージに基づく(安全ではありません):

    static bool IsUnparsedEntityReferenceError_BasedOnMessage(
        XmlSchemaException error)
    {
        return error != null && error.Message.StartsWith(
            "Reference to an unparsed entity", StringComparison.Ordinal);
    }

リフレクションに基づく(非常に安全):

    static readonly PropertyInfo GetResProp = typeof(XmlSchemaException)
        .GetProperty("GetRes", BindingFlags.NonPublic | BindingFlags.Instance);

    static bool IsUnparsedEntityReferenceError_BasedOnReflection(
        XmlSchemaException error)
    {
        return error != null && GetResProp != null && 
            "Sch_UnparsedEntityRef".Equals(GetResProp.GetValue(error, null));
    }

シリアル化形式に基づく (最も安全):

    static bool IsUnparsedEntityReferenceError_BasedOnSerializer(
        XmlSchemaException error)
    {
        if (error == null)
        {
            return false;
        }
        else
        {
            SerializationInfo info = new SerializationInfo(
                typeof(XmlSchemaException), new FormatterConverter());

            error.GetObjectData(info, default(StreamingContext));
            return "Sch_UnparsedEntityRef" == info.GetString("res");
        }
    }
于 2012-11-15T10:23:22.480 に答える