2

指定された文字の直後にアルファベット順になっているRuby1.8.7ユニコード文字を取得するにはどうすればよいですか?

4

1 に答える 1

1

「コードページの次」を意味する場合は、いつでもバイトをハックして調べることができます。コードページを順番に調べていくと、文字が割り当てられていない穴に陥ってしまう可能性があります。このような用語を想像できるのであれば、これは「Unicode-abetically」を意味します。

あなたが「アルファベット順」を意味するなら、それは何も意味しないのであなたは運が悪いです。アルファベット順の概念は言語ごとにかなり異なり、場合によってはコンテキスト固有ですらあります。一部の言語では、文字の順序がまったく設定されていません。これが、一部のシステムにエンコーディングに加えて照合がある理由です。照合は順序を定義しますが、多くの場合、多くの文字は並べ替えの目的で同等と見なされ、事態をさらに複雑にします。

Ruby 1.8.7は、一般的にUnicodeについても認識しておらず、すべてが1バイト文字の8ビットASCII文字列であるかのように見せかけます。Ruby 1.9は、マルチバイトUTF-8を個別の文字に解析できるため、この演習がはるかに簡単になる可能性があります。

于 2012-09-01T05:30:15.930 に答える