“uniq”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

1787 参照

uniq - 「uniq -d」で繰り返し一致を見つけるには

/tmp/1 としての私のデータ

走っても何も得られない

これは奇妙ですuniq -d。

どのように使用できますuniq -dか?

uniq

2009-07-25T11:20:32.347

0 投票する

3 に答える

2101 参照

optimization - シェルでuniqとsortを異なる順序で呼び出す

シェルスクリプトでそれらを呼び出すときの順序uniqに違いはありますか? sort私はここで時間と空間について話している。

対。

140,000 行のテキストファイルでの簡単なテストでは、最初の方法 (uniq 値を取得してから並べ替える) の速度がわずかに向上しました (5.5 秒対 5.0 秒)。

メモリ使用量の測定方法がわかりませんが…</p>

ここでの質問は次のとおりです。順序は違いますか? または、grepから返された行に依存していますか（重複が多い/少ない）

2009-09-09T21:34:31.310

0 投票する

4 に答える

1477 参照

linux - uniq -c の結果をマージします

コマンドの結果を含む多くのファイルがあります: uniq -c some_file > some_file.out

例: 1.out:

2.アウト

これらの結果をマージしたいので、次のようになります。

sort または uniq で処理できると思いましたが、それに関連するオプションはありません。ruby/perl スクリプトを書くのも方法の 1 つですが、コア *nix コマンド (前述の sort や uniq など) を使用して簡単に実行したいと考えています。

編集：明確にするために。元のファイルがなく、*.out ファイルをマージする必要があります。

手伝ってくれてありがとう！

linux merge sorting uniq

2009-09-25T09:34:43.853

0 投票する

8 に答える

207967 参照

linux - 列ごとに「uniq」する方法はありますか？

私はこのような.csvファイルを持っています：

overflow@example.comファイル（つまり、上記の例に含まれている行の1つ）から重複する電子メール（行全体）を削除する必要があります。uniqフィールド1（コンマで区切る）のみで使用するにはどうすればよいですか？によるとman、uniq列のオプションはありません。

で何か試しましたsort | uniqが、うまくいきません。

linux shell sorting uniq

2009-12-16T16:03:16.660

0 投票する

5 に答える

3193 参照

ruby - なぜuniq! 重複がない場合は nil を返す

私は Ruby を使い始めたばかりですが、個人的には、次のことは「最小の驚きの原則」に違反していると感じています。つまり、ドキュメントから引用すると、その uniq! 「自分自身から重複する要素を削除します。変更が行われない場合 (つまり、重複が見つからない場合) は nil を返します。」

私には完全に直感に反しているように思えますが、これを説明できる人はいますか? これは、以下に .uniq! を追加して 1 行のコードを記述できるのではなく、最初の行を終了するには、代わりに次の 2 行を記述する必要があります。

それとも、もっと良い方法がありませんか？

編集：

ユニック了解です！そのオペランドを変更します。これが問題をよりよく示したものです。

私はそのようにユニークだと主張します！作品はそれを完全に無意味で役に立たないものにします。確かに私の場合、指摘したように、最初の行に .uniq を追加するだけです。ただし、同じプログラムの後半で、要素をループ内の別の配列にプッシュしています。次に、ループの下で、配列を「重複排除」したいのですが、あえて「hooks_tested.uniq!」とは書きません。nil を返す可能性があるためです。代わりにhooks_tested = hooks_tested.uniq と書く必要があります

実際、配列を返すメソッドを考案するときは、少なくとも常に nil ではなく空の配列を返す必要があるというのはよく知られた原則であるという点で、これは特にひどい誤機能であると私は主張します。

ruby arrays uniq

2010-01-20T14:59:41.653

0 投票する

3 に答える

6092 参照

hadoop - Hadoop を使用している場合、リデューサーはすべてのレコードを同じキーで取得することが保証されていますか?

実際にHiveを使用してHadoopジョブを実行していますが、これuniqは多くのテキストファイルの行に想定されています。reduce ステップでは、各キーの最新のタイムスタンプ付きレコードを選択します。

Hadoop は、map ステップによって出力された同じキーを持つすべてのレコードが、クラスター全体で多くのレデューサーが実行されている場合でも、単一のレデューサーに送られることを保証しますか?

同じキーを持つ一連のレコードの途中でシャッフルが発生した後、マッパーの出力が分割されるのではないかと心配しています。

hadoop mapreduce hive uniq

2010-04-13T21:16:17.853

0 投票する

6 に答える

140424 参照

linux - Linuxシェルでの並べ替えとuniq

次のコマンドの違いは何ですか？

linux shell sorting uniq

2010-08-01T17:07:26.460

0 投票する

1 に答える

463 参照

linux - uniq：複数の文字または大文字と小文字が異なる場合のみ

たくさんの名前が書かれたテキストファイルを入手しました。1）CASEが異なる（つまりaudiとAuDI）2）複数の文字が異なる（mygoo VS my-goo）アイデアはありますか？

linux sorting uniq

2010-10-29T07:18:52.023

0 投票する

3 に答える

1197 参照

sorting - AWK / sort / uniq を使用して、単純なテキストファイルから最初の列に同じ値を持つ行を削除する方法について、迅速なサポートが必要です

column1 と column2 (スペースで区切られている) に次の内容のテキストファイルがたくさんあります。

アドレス0 データ0

アドレス1 データ1

.

アドレスN データN

すべてのデータ値は一意 (ランダム) ですが、一部のアドレス値は繰り返されます。AWK / sort / uniq を使用して、既に指定されているアドレスを持つ行を削除するにはどうすればよいですか?

基本的に、関連するデータが何であれ、テキストファイル内に重複するアドレスがあってはなりません。

sorting awk uniq

2010-11-11T13:21:05.143

0 投票する

5 に答える

1834 参照

sorting - awkで一意の最初のフィールドを含む行を削除しますか?

最初のフィールドが重複している行のみを印刷しようとしています。たとえば、次のようなデータから:

印刷する必要があります：

(FYI - 私のデータでは、最初のフィールドが常に 1 文字であるとは限りません)

sorting sed awk grep uniq

2011-02-25T23:24:18.027

問題タブ [uniq]

Reference