問題タブ [piglet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
207 参照

vb.net - 子豚の流暢な構成でラテン語の植物名を解析する

私は次のテストを持っています。そしてクラス。今、私はルールを書く方法を見つける必要があります、そしてそれはとても単純に見えました;-)。しかし、私はどこにも速く行きません。タグが言うように、私はこれのために子豚を使って学びたいです。

そして、これが私がこれまでに試したことです。

アップデート

Randompunterのおかげで、最初の2つのテストに合格しました。

0 投票する
1 に答える
1201 参照

hadoop - Join 実行時の Hive vs Pig

Web サイトのログを処理するスクリプトがいくつかあります。このデータを Hive の複数のテーブルにロードしました。これらのスクリプトを毎日実行して、トラフィックの分析を行っています。

最近、これらのスクリプトで作成したハイブ クエリに時間がかかりすぎていることがわかりました。以前は、レポートの生成に約 10 ~ 15 分かかっていましたが、今では同じことを行うのに数時間かかります。

私はデータの分析を行い、データセットの増加の約 5-10% を行いました。

私の友人の 1 人が、複数の Hive テーブルを結合することに関しては Hive は良くないので、スクリプトを Pig に切り替える必要があると提案してくれました。Pig と比較して、Hive はテーブルの結合が苦手ですか?

0 投票する
2 に答える
11345 参照

hadoop - Pig での 2 つのデータセットのマージ

データセットをロードし、それを 2 つの別個のデータセットに分割してから、いくつかの計算を実行し、最後に別の計算フィールドを追加する豚のスクリプトがあります。ここで、これら 2 つのデータセットを再び結合したいと思います。

したがって、基本的に、計算後の両方のスキーマは次のとおりです。

ここで、これを HDFS に戻す前に、2 つのデータ セットをマージして戻します。UNION ALLSQLのようなもの。どうやってやるの?