テキストのエンコードとデコードに関連するさまざまな問題をテストするために使用できる、サンプルのテキスト Unicode ファイル (UTF-8) を探しています。
- 最初の 32 コードなど、ASCII 文字の使用量が少ない
- BMP 外の文字
- NFC 関連の問題
- XML のエンコード/デコードの問題
主に、テキストをクリップボードにコピーし、アプリケーションの HTML テキスト領域に貼り付けて、後でページから取得できるようにしたいと考えています。
これにより、デコード、エンコード、またはデータベース レベルで発生する可能性のあるさまざまな Unicode 関連の問題を特定できます。