問題タブ [csplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - Hadoop でのファイルの分割
テスト目的で特定の行を抽出しようとしている Hadoop クラスターに 8.8G ファイルがあります。
Apache Hadoop 2.6.0に は分割コマンドがないことを確認しましたが、ファイルをダウンロードせずに分割コマンドを実行するにはどうすればよいでしょうか。
ファイルが Linux サーバー上にある場合は、次のようにします。
前のコマンドは期待どおりに機能しますが、Hadoop でこれに近いものはありますか?
r - データフレームから列を削除できません。出力が論理ベクトルに変わります
data.frame
関数から取得した I に何か問題があるようcSplit
です。
NAs
以下のコードを使用しないと、列を抽出できません。
出力は、NA を持つ行を持つ列を持たないNamed logi
ではなく、ベクトルです。data.frame
この問題は、主にパッケージの関数のdata.frame
出力によるものです。この問題は、パッケージを使用しても表示されます。cSplit
splitstackshape
data.table
関数の出力のdata.frame
列を抽出する新しいものを作成しようとしましたが、上記のコードは正常に動作します。data.frame
cSplit
cSplit
のdata.frame
出力の何が問題なのですか?
これが私のコードのサンプルです:
regex - フォーム フィード正規表現を使用して Bash スクリプトで csplit を使用する
フォーム フィードを含む印刷出力ファイル (uncomp.txt) があります。\f 正規表現の一致に基づいて単一のドキュメントを複数のドキュメントに分割し、エポック時間でファイルを出力しようとしています。
私はこれを試しました:
これと同様に:
そしてこれさえ:
しかし、毎回単一のファイルになってしまいます。どうやら \f 正規表現を取得していないようです...何が間違っていますか?
linux - Mac で .json ファイルを複数のファイルに分割する
Mac で実行していて、10 万を超えるオブジェクトを含む非常に大きな .json ファイルがあります。
ファイルを多くのファイル (できれば 50 ~ 100) に分割したいと考えています。
ソースファイル
元の .json ファイルは多次元配列で、次のようになります。
望ましい出力
これが 3 つのファイルに分割されている場合、出力は次のようになります。
ファイル 1:
ファイル 2:
ファイル 3:
どんなアイデアでも大歓迎です。ありがとうございました!
regex - CSplit 正規表現が機能しない
次のファイルの内容があります
---- ---- で分割したい。「----」の間に他の内容が含まれている可能性があります。私は以下を使用していますが、一致が見つからないことを伝え続けています。
regex - Linuxコマンドで正規表現でセクションを選択する方法
私はこれらの行をすべての行が単語で始まり、次に等しいいくつかの文であるため、すべてのセクションを選択するのが好きです。例えば:
たとえば、セクションを選択したい:
私は正規表現でそれをするのが好きです。