“sqoop”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

2546 参照

hadoop - ハイブテーブルからリレーショナルデータベースへのデータパイプラインを作成する方法

バックグラウンド：

ログ情報を含むハイブテーブル「ログ」があります。このテーブルには、1時間ごとに新しいログデータが読み込まれます。過去2日間のログをすばやく分析したいので、過去48時間のデータをリレーショナルデータベースに抽出したいと思います。

上記の問題を解決するために、HIVESQLクエリによってロードされるステージングハイブテーブルを作成しました。新しいデータをステージングテーブルにロードした後、sqoopクエリを使用して新しいログをリレーショナルデータベースにロードします。

問題は、sqoopがBATCHのリレーショナルデータベースにデータをロードしていることです。したがって、特定の時間には、特定の時間のログの一部しかありません。

これは、誤った分析出力につながります。

質問：

1）。このSqoopデータの読み込みをトランザクション化する方法。つまり、すべてのレコードがエクスポートされるか、何もエクスポートされません。

2）。このデータパイプラインを構築するための最良の方法は、Hiveテーブル->ステージングテーブル->リレーショナルテーブルのこのプロセス全体です。

技術的な詳細：

Hadoopバージョン1.0.4Hive -
0.9.0
Sqoop-1.4.2

2013-02-21T10:45:26.847

0 投票する

2 に答える

1504 参照

sql-server - sqoop は SQL Server からインポートするときにロックを取得しますか?

sqoop を使用して SQL Server から HDFS にインポートしています。インポート元のテーブルでロックが取得されているかどうか疑問に思っています。もしそうなら、同等のことを行う方法はありWITH(NOLOCK)ますか?

sql-server hadoop locking hdfs sqoop

2013-02-21T17:54:26.880

0 投票する

2 に答える

1750 参照

hadoop - Sqoop を使用してデータを RCFile 形式にインポートできますか?

http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646によると

区切りテキストまたは SequenceFiles の 2 つのファイル形式のいずれかでデータをインポートできます。

しかし、RCFile はどうでしょうか?

Sqoop を使用して Oracle DB から HDFS に RCFile 形式でデータをインポートすることはできますか?

はいの場合、それを行う方法は？

hadoop format hdfs sqoop

2013-02-21T19:40:02.770

0 投票する

1 に答える

2918 参照

hadoop - S3 への Sqoop 増分インポートの間違った FS エラー

--incremental appendでフラグを使用するsqoop importと、ジョブは失敗します。

ERROR tool.ImportTool: Imported Failed: Wrong FS: s3n://<api_key>:<api_secret>@bucket/folder/

完全なコマンドは次のとおりです。

sqoop import --connect jdbc:postgresql://someplace.net:12345/db --warehouse-dir s3n://<key>:<private>@bucket/folder/ --table my_table --hive-drop-import-delims --escaped-by "\\" --username root --password safepass -m 2 --split-by id --incremental append --check-column id

--incremental' and--check-column`のないまったく同じコマンドはエラーなしで機能し、期待どおりに正しい s3 ディレクトリにアップロードします。増分インポートを実行して、s3 にアップロードできるようにしたいと考えています。

Sqoop 1.4.1-cdh4.1.3 を使用しています

完全な出力:

hadoop cloudera sqoop

2013-02-22T20:52:56.600

0 投票する

2 に答える

312 参照

java - Hadoop クライアントスクリプトを作成および構成する方法

実行中の Hadoop クラスターがあります。Hadoop ディストリビューション (この場合は 0.20.205.0) をダウンロードしました。

そのクラスターで Hadoop を呼び出すことができるシェルスクリプト (bash/zsh/perl) を作成する必要があります。理想的には、次の方法で Sqoop スクリプトから呼び出せるようにする必要があります。

Hadoop を呼び出して namenode/jobtracker URI を提供するにはどうすればよいですか? Sqoop および DB ドライバーで追加のライブラリを提供するにはどうすればよいですか?

java shell hadoop sqoop

2013-02-26T23:06:33.200

0 投票する

2 に答える

451 参照

hadoop - 小数点以下0桁を0E-22としてインポートするSqoop

MSSQLデータベースからhadoopとsqoopを使用してテーブルをインポートし、そのテーブルに10進列がある場合、ゼロの列（0.000000000000 ..など）はすべて「0E-22」として保存されます。

MapまたはReduceで値を小数にキャストすると例外がスローされるため、これは非常に面倒です。したがって、列をキャストする前に、列をvarcharまたはチェックにエクスポートする必要があります。どちらも理想的ではありません。

誰かが以前にこれに遭遇し、回避策を得たことがありますか？

ありがとう

hadoop hive sqoop

2013-03-06T11:55:59.737

0 投票する

1 に答える

3296 参照

database - Sqoop を使用して Sybase からデータをインポートする際の問題

Sqoop を使用して Sybase からデータをインポートしようとしています。ログから、接続を正常に行うことができたと言えます。しかし、私の仕事は失敗し、Sybase からいくつかの SQL 例外が発生しました。私は主に Sybase を扱っているわけではないので、このエラーについて詳しく調べることはできませんでした。私の情報源の 1 つだけが Sybase にあります。

次のコマンドを使用しました：

エラースニペット:

database jdbc hadoop sybase sqoop

2013-03-14T14:07:32.430

0 投票する

1 に答える

9780 参照

hadoop - sqoop ライブラリディレクトリはどこにありますか?

Sqoop に MySQL コネクタをインストールするには、jar ファイルを Sqoop ディレクトリに配置する必要がありますが、見つかりません (.xml にはありません/usr/lib/sqoop)。複数のマシンに Sqoop と Cloudera をインストールしました。

マシンの 1 つで Sqoop ディレクトリはどこにありますか?

hadoop cloudera sqoop

2013-03-19T14:28:26.883

0 投票する

1 に答える

2096 参照

hadoop - sqoop は多くの NULL 行をインポートします

mysql からハイブにテーブルをインポートしています。テーブルには2115584行があります。インポート中に私が見る

しかしcount(*)、インポートしたテーブルで a を実行すると、行があることがわかり49262250ます。何が起こっている？

更新: が指定されている場合、インポートは正しく機能し--directます。

hadoop hive sqoop

2013-03-20T18:47:34.450

0 投票する

5 に答える

13938 参照

apache - Sqoop - メインクラス org.apache.sqoop.Sqoop が見つからないか、読み込めませんでした

Hadoop、Hive、HBase、Sqoopをインストールし、PATH に追加しました。

sqoopコマンドを実行しようとすると、次のエラーが発生します。

開発環境：

OS: Ubuntu 12.04 64 ビット

Hadoop バージョン: 1.0.4

ハイブバージョン: 0.9.0

Hbase バージョン: 0.94.5

スクープバージョン: 1.4.3

apache hadoop hbase hive sqoop

2013-03-20T20:49:10.007

問題タブ [sqoop]

Reference