python - MDAanalysis を使用した PCA (python3.7)

Question

私は計算化学の分野で働き始め、分子動力学の軌跡について主成分分析を行うように依頼されました。私は MDAnalysis パッケージを使用するように言われたので、彼らのページで 1 つのチュートリアルを見つけて、それを実行しようとしました (ただし、もちろん私自身の入力を含めました)。私はこの広告のような分析を行ったことがなく、Python コーディングも初めてです。チュートリアルに触発されたコードを添付しました。しかし、それは私にとってはうまくいきません。多くのエラーが発生します.エラーの1つは、入力を受け取ることができないことです（トポロジはPDBファイル、座標はXTCファイルです）が、それらはサポートされているフォーマットにリストされているフォーマットまたは他のエラーです. 「クラス PCA」は定義されていません。他の人からの MDAanalysis を使用して PCA を処理することについてあまり見つけられなかったので、ここで誰かを見つけられることを望みました。このようなことをしたことがある人は、私を助けてください。関連するサブレディットをすでに試しましたが、結果はありません。

from __future__ import division, absolute_import
import MDAnalysis as mda
import MDAnalysis.analysis.pca as pca

from six.moves import range
import warnings

import numpy as np
import scipy.integrate

from MDAnalysis import Universe
from MDAnalysis.analysis.align import _fit_to
from MDAnalysis.lib.log import ProgressMeter


u = mda.Universe("L22trial.pdb", "L22trial.xtc") 


PCA = mda.analysis.pca.PCA
class PCA():
    pca = PCA(u, select='backbone').run()
    pca_space =  pca.transform(u.select_atoms('backbone'))

    def __init__(self, universe, select='all', align=False, mean=None,
                 n_components=None, **kwargs):
            super(PCA, self).__init__(universe.trajectory, **kwargs)
            self._u = universe

            self.align = align
            self._calculated = False
            self.n_components = n_components
            self._select = select
            self._mean = mean

    def _prepare(self):
        self._u.trajectory[self.start]
        self._reference = self._u.select_atoms(self._select)
        self._atoms = self._u.select_atoms(self._select)
        self._n_atoms = self._atoms.n_atoms

        if self._mean is None:
            self.mean = np.zeros(self._n_atoms*3)
            self._calc_mean = True
        else:
            self.mean = self._mean.positions
            self._calc_mean = False

        if self.n_frames == 1:
            raise ValueError('No covariance information can be gathered from a single trajectory  frame.\n')

        n_dim = self._n_atoms * 3
        self.cov = np.zeros((n_dim, n_dim))
        self._ref_atom_positions = self._reference.positions
        self._ref_cog = self._reference.center_of_geometry()
        self._ref_atom_positions -= self._ref_cog

        if self._calc_mean:
            interval = int(self.n_frames // 100)
            interval = interval if interval > 0 else 1
            format = ("Mean Calculation Step %(step)5d/%(numsteps)d [%(percentage)5.1f%%]")
            mean_pm = ProgressMeter(self.n_frames if self.n_frames else 1, interval=interval, verbose=self._verbose, format=format)
            for i, ts in enumerate(self._u.trajectory[self.start:self.stop:self.step]):
                if self.align:
                    mobile_cog = self._atoms.center_of_geometry()
                    mobile_atoms, old_rmsd = _fit_to(self._atoms.positions, self._ref_atom_positions, self._atoms, mobile_com=mobile_cog, ref_com=self._ref_cog)
                else:
                    self.mean += self._atoms.positions.ravel()
                mean_pm.echo(i)
            self.mean /= self.n_frames

        self.mean_atoms = self._atoms
        self.mean_atoms.positions = self._atoms.positions

    def _single_frame(self):
        if self.align:
            mobile_cog = self._atoms.center_of_geometry()
            mobile_atoms, old_rmsd = _fit_to(self._atoms.positions, self._ref_atom_positions, self._atoms, mobile_com=mobile_cog, ref_com=self._ref_cog)
            x = mobile_atoms.positions.ravel()
        else:
            x = self._atoms.positions.ravel()
        x -= self.mean
        self.cov += np.dot(x[:, np.newaxis], x[:, np.newaxis].T)

    def _conclude(self):
        self.cov /= self.n_frames - 1
        e_vals, e_vects = np.linalg.eig(self.cov)
        sort_idx = np.argsort(e_vals)[::-1]
        self.variance = e_vals[sort_idx]
        self.variance = self.variance[:self.n_components]
        self.p_components = e_vects[:self.n_components, sort_idx]
        self.cumulated_variance = (np.cumsum(self.variance) / np.sum(self.variance))

        self._calculated = True

    def transform(self, atomgroup, n_components=None, start=None, stop=None, step=None):
        if not self._calculated:
            raise ValueError('Call run() on the PCA before using transform')
        if isinstance(atomgroup, Universe):
            atomgroup = atomgroup.atoms
        if(self._n_atoms != atomgroup.n_atoms):
            raise ValueError('PCA has been fit for {} atoms. Your atomgroup has {} atoms'.format(self._n_atoms, atomgroup.n_atoms))
        if not (self._atoms.types == atomgroup.types).all():
            warnings.warn('Atom types do not match with types used to fit PCA')

        traj = atomgroup.universe.trajectory
        start, stop, step = traj.check_slice_indices(start, stop, step)
        n_frames = len(range(start, stop, step))

        dim = (n_components if n_components is not None else self.p_components.shape[1])
        dot = np.zeros((n_frames, dim))

        for i, ts in enumerate(traj[start:stop:step]):
            xyz = atomgroup.positions.ravel() - self.mean
            dot[i] = np.dot(xyz, self.p_components[:, :n_components])

        return dot

def cosine_content(pca_space, i):
    t = np.arange(len(pca_space))
    T = len(pca_space)
    cos = np.cos(np.pi * t * (i + 1) / T)
    return ((2.0 / T) * (scipy.integrate.simps(cos*pca_space[:, i])) ** 2 /
            scipy.integrate.simps(pca_space[:, i] ** 2))

score 1 · Accepted Answer

PCA クラス自体をコピーして貼り付けたようです。私の推測では、これを行う必要はありません (私はそのモジュールを使用したことがないので、単なる推測です)。ドキュメント（https://www.mdanalysis.org/docs/documentation_pages/analysis/pca.html）は、次のことだけを行う必要があることを示しているようです

    import MDAnalysis as mda
    import MDAnalysis.analysis.pca as pca

    u = mda.Universe("L22trial.pdb", "L22trial.xtc") 

    mypca = pca.PCA(u, select='backbone').run()
    pca_space =  mypca.transform(u.select_atoms('backbone'))

「'MDAnalysis.analysis.pca.PCA' という名前のモジュールはありません; 'MDAnalysis.analysis.pca' はパッケージではありません」というエラーメッセージが表示される場合は、その内容を意味します :-)。これは、コンピューターに MDAnalysis という名前のパッケージがないことを意味します。これを修正するには、pip installコマンドを使用してインストールするか、 condaパッケージマネージャーを使用する場合は conda を使用してインストールする必要があります。このリンクを参照してくださいhttps://www.mdanalysis.org/pages/installation_quick_start/

あなたがインスピレーションを得たリンクhttps://www.mdanalysis.org/docs/_modules/MDAnalysis/analysis/pca.htmlを見ると、私の最初の推測が確認されました。私の答えは、そのパッケージを使用できるようにする必要があると思います。

python - MDAanalysis を使用した PCA (python3.7)

1 に答える 1

Related

Reference