Ruby で大きなファイルを操作します。
これから行うことは、改行のない一連の文字を含むギガバイト サイズのファイルにヘッダー行を追加し、結果を新しいファイルに出力することです。(以下に例を示します)。シーケンス内の各位置に 4 文字 (a、c、g、t) のいずれかを指定できます。
私の質問は
ギガバイトサイズのファイルと出力ファイルをバイナリまたはテキストファイルとして開く必要がありますか?
サンプルコードが知りたいです。(できれば、ギガバイト サイズのファイルのすべてのデータを一度にコンピューターのメモリにロードしたくありません。)
ありがとう。
例 プログラム名が add-header-giga の場合 (第 1 引数は header-line、第 2 引数は入力ファイル名を指定。出力ファイル名は output-file)
>cat ギガバイトサイズファイル.txt cctgcaggagcagagcaaagaggtggccatccgcatctttcgggctgccagtttcgctcctggaggctgtgcag.... >add-header-giga DNA-sequence-from-Homo-Sapiens giga-byte-size-file.txt >cat 出力ファイル ホモサピエンスのDNA配列 cctgcaggagcagagcaaagaggtggccatccgcatctttcgggctgccagtttcgctcctggaggctgtgcag....