レイアウトについては、有名な「Lorem ipsum」テキストを使用して、どのように見えるかをテストします。
私が探しているのは、テキスト ファイルを読み取るときに文字エンコーディングを処理するいくつかのメソッドをテストするために JUnit テストで使用できる、いくつかの異なるエンコーディングでエンコードされたテキストを含む一連のファイルです。
例:ISO 8859-1
エンコードされたテスト ファイルとエンコードされたテスト ファイルを持つWindows-1252
。Windows-1252 は、領域 80 16 – 9F 16の違いをトリガーする必要があります。つまり、ISO 8859-1 と区別するために、この地域の文字を少なくとも 1 文字含める必要があります。
テスト ファイルの最適なセットは、各エンコーディングのテスト ファイルにすべての文字が 1 回含まれている場合です。しかし、おそらく私は sth を認識していません - 私たちは皆、このエンコーディングが好きですよね? :-)
文字エンコーディングの問題に対するそのようなテストファイルのセットはありますか?