30

NumPy ndarray行/列ヘッダーを追加したいがあります。

データは実際には7x12x12ですが、次のように表すことができます。

  A=[[[0, 1, 2, 3, 4, 5],
      [1, 0, 3, 4, 5, 6],
      [2, 3, 0, 5, 6, 7],
      [3, 4, 5, 0, 7, 8],
      [4, 5, 6, 7, 0, 9],
      [5, 6, 7, 8, 9, 0]]


     [[0, 1, 2, 3, 4, 5],
      [1, 0, 3, 4, 5, 6],
      [2, 3, 0, 5, 6, 7],
      [3, 4, 5, 0, 7, 8],
      [4, 5, 6, 7, 0, 9],
      [5, 6, 7, 8, 9, 0]]]

ここで、Aは私の2x6x6アレイです。

CSV出力ファイルで各配列が次のようになるように、最初の行と最初の列にヘッダーを挿入するにはどうすればよいですか?

        A, a, b, c, d, e, f 
        a, 0, 1, 2, 3, 4, 5,
        b, 1, 0, 3, 4, 5, 6,
        c, 2, 3, 0, 5, 6, 7,
        d, 3, 4, 5, 0, 7, 8,
        e, 4, 5, 6, 7, 0, 9,
        f, 5, 6, 7, 8, 9, 0

今、私が行ったことは、配列7x13x13を作成し、ゼロの行と列を持つようにデータを挿入したことですが、文字列の方がはるかに好きです。

ゼロを文字列に置き換えるExcelマクロを作成するだけでよいと思います。ただし、問題は、これらのゼロを必要な文字列として再割り当てしようとすると、に変換NumPyできないことです。stringfloat

4

5 に答える 5

41

これによりpandas.DataFrame.to_csv、列とインデックスをファイルに書き込むことができます。

import numpy as np
import pandas as pd

A = np.random.randint(0, 10, size=36).reshape(6, 6)
names = [_ for _ in 'abcdef']
df = pd.DataFrame(A, index=names, columns=names)
df.to_csv('df.csv', index=True, header=True, sep=' ')

次のdf.csvファイルが提供されます。

  a b c d e f 
a 1 5 5 0 4 4 
b 2 7 5 4 0 9 
c 6 5 6 9 7 0 
d 4 3 7 9 9 3 
e 8 1 5 1 9 0 
f 2 8 0 0 5 1    
于 2012-06-21T20:44:02.817 に答える
18

Numpyはn次元配列を適切に処理しますが、機能の多くは2次元配列に制限されています。出力ファイルをどのように表示するかさえわかりません。

名前付き列を希望する多くの人は、numpyのrecarray()機能を見落としています。知っておくとよいことですが、それは1つの次元に「名前を付ける」だけです。

二次元では、パンダはとてもクールです。

In [275]: DataFrame.from_items([('A', [1, 2, 3]), ('B', [4, 5, 6])],
   .....:                      orient='index', columns=['one', 'two', 'three'])
Out[275]: 
   one  two  three
A    1    2      3
B    4    5      6

ここで解決しようとしている問題が出力だけである場合は、1つの機能に別のパッケージをインストールするよりも軽量であるため、おそらく数行の手作業でコーディングされた魔法に固執するでしょう。

于 2012-06-20T17:31:48.947 に答える
3

これは一般的にトリックを行うと思います

入力

mats = array([[[0, 1, 2, 3, 4, 5],
    [1, 0, 3, 4, 5, 6],
    [2, 3, 0, 5, 6, 7],
    [3, 4, 5, 0, 7, 8],
    [4, 5, 6, 7, 0, 9],
    [5, 6, 7, 8, 9, 0]],

   [[0, 1, 2, 3, 4, 5],
    [1, 0, 3, 4, 5, 6],
    [2, 3, 0, 5, 6, 7],
    [3, 4, 5, 0, 7, 8],
    [4, 5, 6, 7, 0, 9],
    [5, 6, 7, 8, 9, 0]]])

コード

# Recursively makes pyramiding column and row headers
def make_head(n):
    pre = ''
    if n/26:
        pre = make_head(n/26-1)

    alph = "abcdefghijklmnopqrstuvwxyz"
    pre+= alph[n%26]
    return pre

# Generator object to create header items for n-rows or n-cols
def gen_header(nitems):
    n = -1
    while n<nitems:
        n+=1
        yield make_head(n)

# Convert numpy to list
lmats = mats.tolist()

# Loop through each "matrix"
for mat in lmats:
    # Pre store number of columns as we modify it before working rows
    ncols = len(mat[0])

    # add header value to front of each row from generator object
    for row,hd in zip(mat,gen_header(len(mat))):
        row.insert(0,hd)

    # Create a "header" line for all the columns
    col_hd = [hd for hd in gen_header(ncols-1)]
    col_hd.insert(0,"A")

    # Insert header line into lead row of matrix
    mat.insert(0,col_hd)

# Convert back to numpy
mats = numpy.array(lmats)

出力(マットに保存された値):

array([[['A', 'a', 'b', 'c', 'd', 'e', 'f'],
        ['a', '0', '1', '2', '3', '4', '5'],
        ['b', '1', '0', '3', '4', '5', '6'],
        ['c', '2', '3', '0', '5', '6', '7'],
        ['d', '3', '4', '5', '0', '7', '8'],
        ['e', '4', '5', '6', '7', '0', '9'],
        ['f', '5', '6', '7', '8', '9', '0']],

       [['A', 'a', 'b', 'c', 'd', 'e', 'f'],
        ['a', '0', '1', '2', '3', '4', '5'],
        ['b', '1', '0', '3', '4', '5', '6'],
        ['c', '2', '3', '0', '5', '6', '7'],
        ['d', '3', '4', '5', '0', '7', '8'],
        ['e', '4', '5', '6', '7', '0', '9'],
        ['f', '5', '6', '7', '8', '9', '0']]], 
      dtype='|S4')
于 2012-06-19T18:55:29.197 に答える
2

よくわかりませんが、Pandasをご覧になることを検討してください。

于 2012-06-19T19:34:58.650 に答える
2

マトリックスにヘッダーを追加する方法を知りません(便利だと思いますが)。私がすることは、__str__関数をオーバーロードして、オブジェクトを出力する小さなクラスを作成することです。

このようなもの:

class myMat:
    def __init__(self, mat, name):
        self.mat = mat
        self.name = name
        self.head = ['a','b','c','d','e','f']
        self.sep = ','

    def __str__(self):
        s = "%s%s"%(self.name,self.sep)
        for x in self.head:
            s += "%s%s"%(x,self.sep)
        s = s[:-len(self.sep)] + '\n'

        for i in range(len(self.mat)):
            row = self.mat[i]
            s += "%s%s"%(self.head[i],self.sep)
            for x in row:
                s += "%s%s"%(str(x),self.sep)
            s += '\n'
        s = s[:-len(self.sep)-len('\n')]

        return s

次に、次のコードを使用して、ヘッダーを使用してそれらを簡単に印刷できます。

print myMat(A,'A')
print myMat(B,'B')
于 2012-06-19T18:44:05.567 に答える