問題タブ [gawk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
awk - いくつかの入力テキスト ファイルから awk の配列に一意の要素のみを追加する方法
トピックが示唆するように、複数のテキスト ファイルから情報を読み込み、異なるテキスト ファイルで複数回発生するかどうかに関係なく、要素を配列に 1 回だけ追加する方法を教えてください。
さまざまなドキュメントで発生する順序ですべての要素を読み込んで出力するこのスクリプトから始めました。
たとえば、次のデータを含む 3 つの異なるテキスト ファイルを見てください。
ファイル 1:
ファイル 2:
ファイル 3:
現在の要素が既に配列に追加されているかどうかを確認したいのですが、今のところ、スクリプトはすべての要素を出力します。
この出力を与える
次を出してほしいとき
1)つまり、最初に要素がすでに配列にあるかどうかを確認し、そうでない場合はそれを追加します
2)可能であれば、後で配列をソートします
ありがとう =)
awk - 入力テキストファイルごとに「何かをする」方法
3 つの異なるテキスト ファイルに保存されている次の情報を読み込んだとします (さらに多くの場合があります)。
ファイル 1
ファイル 2
ファイル 3
この情報を読み取るときに、これらの2つのファイルからこの情報を別々の配列に出力したいのですが、今のところそれらは同時に出力されます
これで、このスクリプトですべての情報を同時に出力できます
しかし、複数のファイルを読み込んで、すべてのテキスト ファイルに対してこれを行う方法はありますか? awk -f test.awk 1.txt 2.txt 3.txtを実行するときにこの出力を取得する代わりに
私はこの出力を得る
また、30 ほどのテキスト ファイルがあるため、一度に各ファイルを読み込むことはできません。
編集_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ _ _ _ _ _ _
このようなことをするつもりなので、可能であればawkでこれをやりたいです
awk - 何をすべきかを知る方法
私はawkを使用しており、任意の数のテキストファイル(引数)をスクリプトに送信し、入力ファイルごとに「何かを印刷」したいと考えています。
ここでスクリプトを見つけました
そして、スクリプトをこれに変更しました
nfiles="10"
問題は、任意の数のテキスト引数であると想定されているため、何を書き込むかです。
また、このスクリプトはよくわかりません。このセクションのみを実行します
そして、file1.txt からの情報のみを出力します。$3
残りを実行しないのはなぜですか。また、すべてのファイルから行 3 ( ) のすべてを に出力したい場合はどうすればよいでしょうoutput3
か? ありがとう =)
gawk - gawk : 特殊記号からデータを抽出する
strace -T から合計時間を取得しようとしていますが、次のように報告されています。
pid コマンド [時刻]
(システムコールごと)
[time] を合計したいと思います。私は gawk を使用していますが、最後のフィールドには $NF でアクセスできることを知っています。ただし、 $NF は時間だけではなく [time] (括弧付き) を報告しますが、これは明らかに合計できません。そのため、 [time] の代わりに時間を取得するにはどうすればよいでしょうか?
ありがとう
linux - AWK TCP 接続を特定の IP にバインドする
ポート 80 はすでに eth0:1 (lighttpd サーバー) で使用されていますが、AWK プロセスを eth0 にバインドしたいと考えています。
AWK プロセスをバインドする IP を定義する方法はありますか?
sed - 一部交換用セッド?
次のタイプの行を含むファイルがあるとします。
FIXED_DATA1 VARIABLE_DATA FIXED_DATA2
固定データは変更し、可変データはそのままにしたい。さまざまな理由により、2 つの sed 操作を使用して固定データを置き換えることはできません。たとえば、固定フィールドは二重引用符で囲まれている可能性があり、行にはそれらを含む他の領域があるため、実際には変数データと固定データのパターンに一致するように正規表現が書き込まれます。
sed を使いたがっている場合、変数フィールドを変更せずに両方の固定データ フィールドを一度に変更する方法はありますか?
ありがとう。
linux - awk を使用してマルウェアのバイラル アクティビティを把握するために必要な支援
マルウェアがファイルの末尾または先頭にコードを追加することがあるため、サーバーで問題に直面しています。私の知る限り、セキュリティの抜け穴を修正しました。私のホスティング プロバイダーは、現在セキュリティが十分であると通知していますが、私は自分のサイトでのウイルス/マルウェアの活動に神経質になっています。計画はありますが、sed や awk や gawk などの Linux エディターに精通していないので、あなたの助けが必要です。私の PHP の知識を使用してこれを行うことができますが、それは非常にリソース集約的です。
マルウェア/ウイルスはファイルの先頭または末尾にコードを追加するため (ウェブサイトにエラーが表示されないようにするため)、すべての .php ファイルを再帰的に調べるコマンドの書き方を教えてください (私は使用します他のタイプのファイルを変更するためのヘルプ) を親ディレクトリとすべてのサブディレクトリに追加し、ファイルの最初と最後に特定のタグを追加します (XXXXXX_START と YYYYYY_END など)。
次に、すべての .php ファイルを読み取り、コードの最初の行が XXXXX_START で最後の行が YYYYYYY_END であるかどうかを確認し、ファイルが異なる場合はレポートを作成するスクリプトが必要です。
cron をセットアップしてすべてのファイルをチェックし、不一致が見つかった場合はレポートをメールで送信します。
ウイルスがコメント行の後にデータを追加する可能性があるため、これが 100% 絶対確実ではないことはわかっていますが、これは私が考えることができる最良のオプションです。
最初にデータを追加するために次のコマンドを試しました-
ただし、これは再帰的ではなく、親ディレクトリ ファイルのみに行を追加します。
それから私はこれを見つけました - BEGIN と END は特別なパターンです。入力レコードの照合には使用されません。むしろ、awk スクリプトに起動情報またはクリーンアップ情報を提供するために使用されます。BEGIN ルールは、最初の入力レコードが読み取られる前に 1 回実行されます。END ルールは、すべての入力が読み取られた後に 1 回実行されます。例えば:
しかし、残念ながら、私は何も解読できませんでした。
上記の詳細に関するヘルプは大歓迎です。他の提案は大歓迎です。
よろしく、
ニチン
ruby - テキストファイルの解析
以下の例のように、sudo テーブルで満たされた多くのテキスト ドキュメントがあります。テーブルをハッシュや配列のようなものに解析する最良の方法は何でしょうか?
カスタム アルゴリズムを作成する必要がありますか、それとも既存のライブラリがありますか?
perl - キーワード、前の単語、後の単語を返す Perl または Gawk スクリプトですか?
大きなxml ファイルでキーワードを検索し、その前の単語、キーワード、および後の単語を返す単純なスクリプトを Windows で実行する必要があります。
例: 「コンテキストでキーワードを抽出するにはどうすればよいですか」
私はキーワードを含む各行とその前後の行を返すのに十分な知識を持つ初心者ですが、必要な個々の単語を取得することに困惑しています。
誰にも賢いアイデアはありますか?