5

無向グラフ検索に使用される 1 つ (または 2 つ) の 500,000 項目以上の辞書を考えると、python に大量のデータを保存する最良の方法は何ですか?

データを XML として保存するなど、いくつかのオプションを検討しています。

<key name="a">
    <value data="1" />
    <value data="2" />
</key>
<key name="b">
...

または直接アクセスするためのpythonファイルで:

db = {"a": [1, 2], "b": ...}

またはSQLデータベースで?これが最善の解決策だと思いますが、Python 自体よりも SQL に頼って計算を行う必要がありますか?

4

6 に答える 6

6

Python のソース テクニックは絶対的なルールです。

XML は解析が遅く、比較的読みにくいものです。それが、Altova のような企業がビジネスを行っている理由です。XML は編集するのが楽しいものではありません。

パイソンソースdb = {"a": [1, 2], "b": ...}

  1. 解析が速い。

  2. 人が読みやすい。

巨大な辞書を読み書きするプログラムがpprintある場合は、適切にフォーマットされた出力が得られるように書き込みに使用してください。何か読みやすい。

移植性が心配な場合は、オブジェクトのシリアル化に YAML (または JSON) を検討してください。XML よりもはるかに読みやすく、解析も高速です。

于 2009-01-13T11:37:45.170 に答える
2

Pythonで利用可能な多くのグラフライブラリの1つを使用することを検討します(例:python-graph

于 2009-01-13T07:36:51.177 に答える