1

比較的古いプログラムで使用されている形式のバイナリ データ ファイルがあり、それを適切なものに変換しようとしています。Hex エディターの助けを借りて、私は基本的にファイル形式を作成しましたが、奇妙なエンコーディングのヘブライ文字が含まれています。

すべての文字は 8 ビットです。「標準」の 27 個の子音 (「最終」子音を含む) は、16 進数 80 から 9A までです。次に、16進数9Bかそこらあたりから始まる母音があります(標準の子音が終わった直後だと思います)。次に、16 進 E0 で始まるように見える「点線の」子音があります。

私の記憶が正しければ、これはある種の DOS エンコーディングだと思います。これはどのエンコーディングで、イスラエルのユーザーが Microsoft Word などで最も簡単に開くことができるようにするには、どのエンコーディングに変換する必要がありますか? 翻訳に使用できるツールはありますか?

4

1 に答える 1

1

80から9Aは、CP862のコードポイントと一致しているようですが、母音のコードポイントと一致するものは見つかりませんでした。Unicodeへのカスタムマッピングを作成し、UTF-8またはUTF-16LEプレーンテキストファイルで出力を生成するだけでよいと思います。BOM(Byte-Order-Mark)を追加すると、メモ帳やWordで問題なく読み取ることができるはずです。私はおそらく小さなPythonスクリプトを作成しますが、他の言語では難しいことではありません。

于 2010-10-21T12:47:48.677 に答える