XML ファイルがあり、その中に 2 つの単語の値を持つ 1 つのフィールドがあります。たとえば、次のようになります。
<NAME>INTERNET WEB</NAME>
これがいくつかのデータベースにインポートされると、この値は INTERNET WEB のように保存されませんが、一見するとデータベース内の値とまったく同じに見えます!!!
しかし、INTERNET と WEB という単語の間に空白が 1 つもないように見えますが、前述したように、それはその値のようです。それの代わりに何か他のものがあるように、違いは見えません。
問題は、そのフィールドがそのように保存されていないように見えるため、値INTERNET WEBでそのフィールドをフィルタリングできないことです。では、何が問題になるのでしょうか?別の外部システムから受け取ったこの XML ファイル。
たとえば、この値に空白の代わりにタブが含まれているかどうか、または不適切な形式でエンコードされているかどうかを判断するにはどうすればよいですか (UTF-8 は XML ファイルの上部にあります)
<?xml version="1.0" encoding="UTF-8"?>
)
Notepad ++で「XML構文の確認」を行ったところ、エラーが検出されなかったため、XMLはOK形式であると表示されます。