問題タブ [task-tracking]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - マッパーまたはレデューサー内からHadoopタスクトラッカー情報を取得する方法
MapperクラスとReducerクラスは、常に特定のタスクトラッカーで実行されます。しかし、タスクトラッカーに関する情報を取得するにはどうすればよいですか?メソッドに渡されるのsetup
はTaskInputOutputContextだけです。タスク試行IDを取得できますが、これをTaskTrackerオブジェクトにマップするにはどうすればよいですか?(たとえば、ホスト名、対応するジョブトラッカーなどを取得します。はい、ホスト名を取得できることはわかっていますがjava.net.InetAddress.getLocalHost().getHostName()
、これは完全にHadoopの外部にあります。)
hadoop - スレーブがマスターに接続できず、hadoop で tasktracker または datanode を開始できない
2 ノードの完全分散 Hadoop クラスターを使用しています。tasktracker を接続してスレーブ ノードで実行しようとしていますが、9000/9001 ポートに接続できません。以下は設定ファイルです。
Tasktracker からのエラー メッセージ (マスターで start-all を使用して実行)
マスター ホスト ファイル
MASTERコアサイト.xml
MASTER mapred-site.xml
MASTER マスターファイル
マスタースレーブファイル
SLAVE ホスト ファイル
SLAVE core-site.xml
スレーブ mapred-site.xml
SLAVEマスターファイル
performance - 1 つの MapReduce TaskTracker を使用した 10 ノードでの Hadoop CDH5 最大ネットワーク パフォーマンス
1 つの MapReduce TaskTracker を備えた 10 ノードの CDH5 Cloudera で最大のネットワーク パフォーマンスを得ようとしていますが、必要なトラフィックを生成するためのトラフィックを取得できないようです。私は 40G の NIC カードを持っていますが、現在、最大で 10G しか得られないのは非常に低いです。
1 つの MapReduce TaskTracker を使用する場合、パフォーマンスとネットワーク スループットを向上させるにはどうすればよいですか?
実行中 -- 10 ノード RedHat 6.6 現在の Nic ドライバー CDH5 カーネル: 3.18.1
9 つの MapReduce TaskTracker ノードを廃止しましたが、まだ良い結果が得られていません。
google-sheets - 参照ドキュメントが最後にいつ変更されたかを判断する Google スプレッドシート関数
コンテキスト: 毎日のタスクを含む Google スプレッドシート ドキュメントがあります。私のタスクの多くは、過去 1 日に他の Google スプレッドシート (私の毎日のタスク ドキュメントで参照) に変更が加えられたかどうかを確認することです。
目標: 参照されている Google シートの 1 つが最後に変更されたのはいつかを教えてくれる関数が必要です。
例を次に示します: https://docs.google.com/spreadsheets/d/1JV-ZvO1P5PPU2Eoi7qSIKaeBWgHkmAA0BLEh8OmLCGI/edit?usp=sharing
関数をB列に入れたいです。