java - Hadoop Mapreduce を使用して EBCDIC を TEXT に変換する方法

Question

EBCDIC 入力ファイル形式を解析する必要があります。Javaを使用すると、以下のように読むことができます：

InputStreamReader rdr = new InputStreamReader(new FileInputStream("/Users/rr/Documents/workspace/EBCDIC_TO_ASCII/ebcdic.txt"), java.nio.charset.Charset.forName("ibm500"));

しかし、Hadoop Mapreduce では、RecordReaderこれまで機能していなかった via を解析する必要があります。

誰でもこの問題の解決策を提供できますか?

score 0 · Accepted Answer

ファイルがEBCDICである理由は??? である必要がありますか ???

ただのテキストデータなら、メインフレーム/AS400からファイルを送受信する際にasciiに変換してみませんか???.

ファイルにバイナリまたは Cobol 数値フィールドが含まれている場合、いくつかのオプションがあります。

メインフレームでファイルを通常のテキストに変換し (メインフレームの Sort ユーティリティはこれに適しています)、ファイルを送信して (ascii に) 変換します。
Cobol ファイルの場合は、 https://github.com/tmalaska/CopybookInputFormatまたはhttps://github.com/ianbuss/CopybookHadoopを参照できるオープンソースプロジェクトがいくつかあります。
メインフレーム COBOL データを Hadoop にロードするための商用パッケージがあります。

java - Hadoop Mapreduce を使用して EBCDIC を TEXT に変換する方法

3 に答える 3

Related

Reference