私はいくつかの考えを提供することができます:
1: ドキュメントとサンプルは、Hadoop を使用する私のプロジェクトと関連プロジェクトにとって大きな課題でした。MySQL と比較すると、どの機能が利用可能で、どのように使用するかを見つけるのは難しいことがよくあります。この点で、メーリングリストは非常に役立ちました。バッチ処理と「フル テーブル スキャン」の観点からの考え方を学ぶことも適応であり、Map Reduce プログラミングに慣れることは簡単ではありませんが、未加工の Map Reduce を記述しないようにするために利用できるツールは数多くあります。
2: Hadoop とその仲間のコード ベースの多くは基本的にまだアルファウェアであり、バージョンごとに大きく変わることがあります。最初にテスト クラスターでアップグレードを行い、何が壊れているかを確認する必要があります。アップグレード中の API の劇的な変更は予期しないものではありません。
3: 特に memcached を使用したことはなく、ページのレンダリングではなく、バックエンドの ETL 処理に Hadoop を使用しています。ここであなたを本当に助けることはできません。
4: プロジェクトを理解する最善の方法は、コードを入手して調べてみることです。しばらく使ってみると、最終的には、もっとうまくできると思うものや、必要な機能が見つかるでしょう。それは参加するのに最適な場所です。必ず開発者メーリング リストにサインアップし、既存のバグや機能要求のリストに注意して、誰かが既に同様の作業を行っているかどうかを確認してください。これらのプロジェクトのほとんどは、コミット権を持つ誰かにコードを入れてもらう必要がありますが、それほど難しくありません。より具体的な情報については、貢献したい特定のプロジェクトを読んでください。