0

KDD-CUP-99 データセット (ここにあります: http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html ) を MongoDBにインポートしようとしています。次のコマンドを使用して、1 台のマシンでこれを実行しました。

mongoimport --db dbName --collection colName --type csv --file kddcup.data.corrected --fieldFile kddcup99header

結果を見るために findOne() を使用すると、すべてがうまく見えます。出力は次のとおりです。

> db.colName.findOne()
{
    "_id" : ObjectId("547c33e376945996ed878f81"),
    "duration" : 0,
    "protocol_type" : "tcp",
    "service" : "http",
    "flag" : "SF",
    "src_bytes" : 215,
    "dst_bytes" : 45076,
    "land" : 0,
    "wrong_fragment" : 0,
    "urgent" : 0,
    "hot" : 0,
    "num_failed_logins" : 0,
    "logged_in" : 1,
    "num_compromised" : 0,
    "root_shell" : 0,
    "su_attempted" : 0,
    "num_root" : 0,
    "num_file_creations" : 0,
    "num_shells" : 0,
    "num_access_files" : 0,
    "num_outbound_cmds" : 0,
    "is_host_login" : 0,
    "is_guest_login" : 0,
    "count" : 1,
    "srv_count" : 1,
    "serror_rate" : 0,
    "srv_serror_rate" : 0,
    "rerror_rate" : 0,
    "srv_rerror_rate" : 0,
    "same_srv_rate" : 1,
    "diff_srv_rate" : 0,
    "srv_diff_host_rate" : 0,
    "dst_host_count" : 0,
    "dst_host_srv_count" : 0,
    "dst_host_same_srv_rate" : 0,
    "dst_host_diff_srv_rate" : 0,
    "dst_host_same_src_port_rate" : 0,
    "dst_host_srv_diff_host_rate" : 0,
    "dst_host_serror_rate" : 0,
    "dst_host_srv_serror_rate" : 0,
    "dst_host_rerror_rate" : 0,
    "dst_host_srv_rerror_rate" : 0,
    "unknown" : "normal."
}

現在、同じファイルとコマンドを使用して別のマシンで同じインポート操作を実行していますが、何かが正しく機能していません。インポートの結果は次のとおりです。

> db.colName.findOne()
{
    "_id" : ObjectId("547d8f94facff0761ae10688"),
" : 0,  "duration
" : "tcp",rotocol_type
" : "http",rvice
" : "SF",flag
" : 215,"src_bytes
" : 45076,st_bytes
" : 0,  "land
" : 0,  "wrong_fragment
" : 0,  "urgent
" : 0,  "hot
" : 0,  "num_failed_logins
" : 1,  "logged_in
" : 0,  "num_compromised
" : 0,  "root_shell
" : 0,  "su_attempted
" : 0,  "num_root
" : 0,  "num_file_creations
" : 0,  "num_shells
" : 0,  "num_access_files
" : 0,  "num_outbound_cmds
" : 0,  "is_host_login
" : 0,  "is_guest_login
" : 1,  "count
" : 1,  "srv_count
" : 0,  "serror_rate
" : 0,  "srv_serror_rate
" : 0,  "rerror_rate
" : 0,  "srv_rerror_rate
" : 1,  "same_srv_rate
" : 0,  "diff_srv_rate
" : 0,  "srv_diff_host_rate
" : 0,  "dst_host_count
" : 0,  "dst_host_srv_count
" : 0,  "dst_host_same_srv_rate
" : 0,  "dst_host_diff_srv_rate
" : 0,  "dst_host_same_src_port_rate
" : 0,  "dst_host_srv_diff_host_rate
" : 0,  "dst_host_serror_rate
" : 0,  "dst_host_srv_serror_rate
" : 0,  "dst_host_rerror_rate
" : 0,  "dst_host_srv_rerror_rate
    "unknown" : "normal."
}

同じデータ ファイルとコマンドを使用しているのを見て、環境内の何かに違いないと考えました。システムのロケール設定は同じですが、インポートは正しく機能しません。誰もそのような行動を見たことがありますか?

編集両方のマシンが同じバージョンの MongoDB を実行していることを追加する必要があります: 2.6.5

4

2 に答える 2

1

ファイルが両方のマシンで本当に同じであることを確認することをお勧めします。

md5sum kddcup.data.corrected kddcup99header

mongoimportまた、ツールのバージョンも確認します。

mongoimport --version
于 2014-12-02T12:50:18.823 に答える
0

@helmyの回答に基づいて、最終的には長い道のりを歩んできました。稼働中の Mongo インスタンスからエクスポートし、これを稼働していないインスタンスにインポートしました。

于 2014-12-02T15:34:39.093 に答える