パラグラフを 16 進数表記に変換し、元の文字列形式に戻すにはどうすればよいでしょうか?
(C#)
補足: 文字列を 16 進形式にすると、ハードコアな縮小アルゴリズムに入ることなく、最も縮小されますか?
「16進表記」とは正確にはどういう意味ですか?これは通常、テキストではなく、バイナリ データのエンコードを指します。テキストを何らかの方法でエンコードし (UTF-8 を使用するなど)、各バイトを文字のペアに変換してバイナリ データをテキストとしてエンコードする必要があります。
using System;
using System.Text;
public class Hex
{
static void Main()
{
string original = "The quick brown fox jumps over the lazy dog.";
byte[] binary = Encoding.UTF8.GetBytes(original);
string hex = BytesToHex(binary);
Console.WriteLine("Hex: {0}", hex);
byte[] backToBinary = HexToBytes(hex);
string restored = Encoding.UTF8.GetString(backToBinary);
Console.WriteLine("Restored: {0}", restored);
}
private static readonly char[] HexChars = "0123456789ABCDEF".ToCharArray();
public static string BytesToHex(byte[] data)
{
StringBuilder builder = new StringBuilder(data.Length*2);
foreach(byte b in data)
{
builder.Append(HexChars[b >> 4]);
builder.Append(HexChars[b & 0xf]);
}
return builder.ToString();
}
public static byte[] HexToBytes(string text)
{
if ((text.Length & 1) != 0)
{
throw new ArgumentException("Invalid hex: odd length");
}
byte[] ret = new byte[text.Length/2];
for (int i=0; i < text.Length; i += 2)
{
ret[i/2] = (byte)(ParseNybble(text[i]) << 4 | ParseNybble(text[i+1]));
}
return ret;
}
private static int ParseNybble(char c)
{
if (c >= '0' && c <= '9')
{
return c-'0';
}
if (c >= 'A' && c <= 'F')
{
return c-'A'+10;
}
if (c >= 'a' && c <= 'f')
{
return c-'A'+10;
}
throw new ArgumentOutOfRangeException("Invalid hex digit: " + c);
}
}
いいえ、これを行うと、まったく縮小しません。まったく逆です。より多くのテキストが表示されることになります。ただし、バイナリ形式を圧縮することはできます。任意のバイナリ データをテキストとして表現するという点では、Base64 はプレーンな 16 進数よりも効率的です。変換にはConvert.ToBase64StringとConvert.FromBase64Stringを使用します。
public string ConvertToHex(string asciiString)
{
string hex = "";
foreach (char c in asciiString)
{
int tmp = c;
hex += String.Format("{0:x2}", (uint)System.Convert.ToUInt32(tmp.ToString()));
}
return hex;
}
本当は何をしようとしているのですか? 通常の文字列を 16 進数表現の文字列に変換することは、Web 用の 16 進数/エンコーディングのチュートリアルを作成している場合を除き、何に対しても間違ったアプローチのように思えます。
C# の実装についてはあまり役に立ちませんが、実装が簡単なデータ圧縮アルゴリズムとしてLZWを使用することを強くお勧めします。
static byte[] HexToBinary(string s) {
byte[] b = new byte[s.Length / 2];
for (int i = 0; i < b.Length; i++)
b[i] = Convert.ToByte(s.Substring(i * 2, 2), 16);
return b;
}
static string BinaryToHex(byte[] b) {
StringBuilder sb = new StringBuilder(b.Length * 2);
for (int i = 0; i < b.Length; i++)
sb.Append(Convert.ToString(256 + b[i], 16).Substring(1, 2));
return sb.ToString();
}