4

テキストのエンコードとデコードに関連するさまざまな問題をテストするために使用できる、サンプルのテキスト Unicode ファイル (UTF-8) を探しています。

  • 最初の 32 コードなど、ASCII 文字の使用量が少ない
  • BMP 外の文字
  • NFC 関連の問題
  • XML のエンコード/デコードの問題

主に、テキストをクリップボードにコピーし、アプリケーションの HTML テキスト領域に貼り付けて、後でページから取得できるようにしたいと考えています。

これにより、デコード、エンコード、またはデータベース レベルで発生する可能性のあるさまざまな Unicode 関連の問題を特定できます。

4

1 に答える 1

8

このページは、いくつかのスクリプトのテキストを使用して、Web ブラウザーをテストするために使用されています: https://www.kermitproject.org/utf8.html

特に「I can eat glass」のゴシック エントリは BMP の外にあります: ̈, .

正規化フォームと XML 処理は通常、データを移動するときに問題にならないため、これら 2 つを特にテストする一般的なサンプルはありません。

于 2013-05-13T12:21:48.303 に答える