“data-dump”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

42 参照

python - ファイルを分割すると、サイズが劇的に増加します

4GB の Wiktionary XML データダンプを小さなファイルに分割し、オーバーラップせずに Python で処理し、個別のページを保存しています (...)。

異なるファイルに分割された同じ情報が、18 GB 以上に膨れ上がっています。

これはなぜでしょうか？そして、これを回避する方法はありますか？

2015-10-29T18:19:06.847

0 投票する

1 に答える

2235 参照

firebird - FBexport - isc_dsql_prepare が失敗しました - 出力を作成できません

fbexport という firebird ツールを使用して、DB からテーブルデータのダンプを作成しています。私がやったことは次のとおりです。

cmd を起動し、fbexport があるディレクトリに移動します。
コマンドを入力します。

FBExport.exe -D "c:\DB.GDB" -U sysdba –P マスターキー -Si -V WIZYTY -F test.out

残念ながら、私はエラーを受け取りました：

それを機能させる方法はありますか？

firebird data-dump fbexport

2016-03-08T15:23:32.537

0 投票する

1 に答える

43 参照

database-design - SO のデータベーススキーマに関する混乱

内部使用のための QA プラットフォームを開発する必要があるため、SEDEを調査しました。ユーザーの upvote/downvote/favorite/etc を投稿に格納するテーブルVotesがあることに気付きました。 HERE、しかし私のSOプロファイルのVotes Castの下には間違いなく賛成票と反対票の履歴があります! これはどのように起こりますか？StackExchange によって公開されたこれらのテーブルは不完全ですか、それとも何か不足していますか?

返信ありがとうございます。

database-design data-modeling qa data-dump sede

2016-05-09T12:33:18.933

0 投票する

0 に答える

206 参照

python - 非常に大きな書き込み集中型の MySQL インポート

MySQL データベース (InnoDB エンジン) にインポートされている、約 400 GB の大量のプレーンテキストファイルのセットがあります (私が考えていること)。.txt ファイルのサイズは 2GB から 26GB で、各ファイルはデータベース内のテーブルを表します。.txt ファイルを解析して SQL ステートメントを作成する Python スクリプトが与えられました。私は、次の仕様のこのタスク専用のマシンを持っています。

OS - Windows 10
32GBのRAM
4TBのハードドライブ
i7 3.40 GHz プロセッサー

このインポートを最適化して、可能な限り迅速かつダーティにしたいと考えています。スタック O の質問、MySQL ドキュメント、およびその他のソースに基づいて、MySQL my.ini ファイルの次の構成設定を変更しました。

マシンのリソースのかなりの部分を使用するように MySQL に指示する、私が見逃した構成ファイルの他の設定 (ログやキャッシュに関するものかもしれません) はありますか? 私が見逃している別のボトルネックはありますか？

(サイドノート: これが関連しているかどうかはわかりません - インポートを開始すると、mysqldプロセスがスピンアップしてシステムのメモリの約 13-15% を使用しますが、Python スクリプトがインポートを続行するのを停止すると、プロセスは決してパージされないようです。 . これはログとフラッシュの設定をいじった結果なのだろうか. 事前に助けてくれてありがとう.)

（編集）

テーブルにデータを入力する Python スクリプトの関連部分を次に示します。スクリプトは、50,000 レコードごとに接続、コミット、および接続を閉じているようです。関数の最後にあるを削除してconn.commit()、MySQL にコミットを処理させることはできますか? 以下のコメントwhile (true)はスクリプトの作成者からのもので、max_allowed_packet サイズを超えないようにその数を調整しました。

python mysql database windows data-dump

2016-05-23T20:57:45.570

0 投票する

1 に答える

104 参照

marklogic - 巨大なファイルを MarkLogic DB にダンプするより良い方法

私はMarkLogicを初めて使用し、条件に基づくフィルターなどの変換を使用して巨大なcsv /テキストデータをダンプするように評価しています。私が知る限り、2つの方法を使用してデータをダンプできます。

これを達成するためのより良い方法はどれですか？または、私が知らない他のものがある場合。

前もって感謝します。

marklogic marklogic-8 data-dump marklogic-7

2016-06-10T10:29:16.093

0 投票する

1 に答える

409 参照

sqlite - 選択クエリを SQL 挿入コマンドとして出力できる SQLite コマンドはありますか?

Zeoslib を使用して SQLite でメモリ内データベースを作成しています。プログラムを閉じるときにデータベースをディスクに保存するか、定期的にファイルにダンプする必要があります。

SELECTSQLite3 プログラムはメモリ内データベースを処理できないため、クエリの出力をINSERTステートメントとしてエクスポートする SQLite を取得する方法はありますか?

PS。sqlite3このスレッドに示されているように、メモリ内データベースをディスクにダンプできますが、メモリ内データベースは別のアプリケーションによって作成されているため、例を機能させる方法がわかりません。

sqlite lazarus in-memory-database zeos data-dump

2016-07-03T17:05:21.540

0 投票する

1 に答える

15 参照

oracle11g - 並列度がNに設定されている場合、Oracle DataDumpがN-1ファイルを作成するのはなぜですか?

私は何を間違っていますか？

PARALLEL=4 に設定しましたが、作成されるファイルの数は 3 です。

4 つのファイルを期待していましたが、3 つになりました:

oracle11g data-dump

2017-04-11T17:45:32.367

0 投票する

2 に答える

65 参照

python - パンダを使用した「so dump」からの文の抽出

プロジェクトの一環として、スタックオーバーフローダンプを使用することになっています。現在、初心者のプログラマーである私は、Pandas ライブラリーで次のタスクを実行する際に問題に直面しています。

次のような .csv ファイルがあります。

次のような別の .csv ファイルを取得したいと考えています。

python csv pandas data-processing data-dump

2017-06-18T21:14:17.790

問題タブ [data-dump]

Reference