現在、いくつかのテキスト ファイルを MongoDBにロードしようとしています (それらは JSON 形式です)。
OS walk を使ってみたのですが、うまくいかないようです。私の現在の方法は次のとおりです。
>>> import pymongo
>>> import os
>>> import json
>>> from pymongo import Connection
>>> connection = Connection()
>>> db = connection.Austin
>>> collection = db.tweets
>>> collection = db.tweet_collection
>>> db.tweet_collection
Collection(Database(Connection('localhost', 27017), u'Austin'), u'tweet_collection')
>>> collection
Collection(Database(Connection('localhost', 27017), u'Austin'), u'tweet_collection')
>>> tweets = db.tweets
>>> tweet = open(os.path.expanduser('~/Tweets/10_7_2012_12:09-Tweets.txt'),'r')
>>> for line in tweet:
... d = json.loads(line)
... tweets.insert(d)
...
単一のツイートを挿入します。複数のファイルを開いて同じコードを実行できるようにしたいと考えています。つまり、JSON を Python 辞書に変換し、それをコレクションに自律的に挿入する for ループです。
誰かがこれを行う方法の確かな例を持っていますか?
このトピックについて話している間、私はデータベースの理解が不十分な状態で MongoDB を使用しようとしています (愚かで愚かなことはわかっています) が、MongoDB はデータベースの複数のインスタンスを同時にサポートし、グループであるコレクションを格納できます。個別のドキュメントを挿入できますよね?
(また、コレクションのつぶやきと tweet_collection の間の矛盾を無視してください。理解を深めるために実験しただけです)