3

私は自分の機関のデータベースで遺伝的変異データを表現しようとしています。参照対立遺伝子、変異対立遺伝子、染色体、位置、名前、考えられる効果、遺伝子、遺伝子内の位置などに関連する遺伝的変異を発見しました。

質問のコンテキストが役立つ場合もありますが、これはdjangoで構築し、dbバックエンドはPostgreSQLまたはMySQLのいずれかになります(質問の主な焦点ではありませんが、ここでの選択に関する提案も歓迎します)

この情報を適切に表現するために、私はリレーショナルデータベースの設計に着手しました。しかし、最も効率的な構造を定義する際に問題が発生しています。私はそれを次のように表すことができます:

バリアントは、多対1の関係で遺伝子に属します。つまり、1つの遺伝子に多くのバリアントを含めることができますが、通常、1つのバリアントが複数の遺伝子にまたがることはできません。(ただし、これは大きなCNVで発生する場合や、2つの遺伝子が重複する場合に発生する可能性があるため、多対多の関係になる可能性があります???)

変異体は個人でも発見されています。個体には遺伝子型があり、これは変異体の対立遺伝子のさまざまな組み合わせの2つのコピーにすぎません。これに最適かどうかはまったくわかりません。おそらく、バリアントと個体の共同主キーであり、遺伝子型を変異対立遺伝子の数として記録します(たとえば、0、1、2)???

だから私の質問は(すべての前文とバイオトークで申し訳ありませんが)私たちがどのように最善であるか、またはこれらの3つのもののためのより良いデザインです:バリアント-私が情報を保存したい主なもの、そして遺伝子、そして個人-どちらもダウンストリーム分析に不可欠です。

どんなアドバイスも大歓迎です。質問のやや短命な性質についても申し訳ありません。

4

1 に答える 1

2

ええと、私は遺伝子について何も知りませんし、バイオ用語も話しません。しかし、私はあなたの質問とウィキペディアからいくつかの提案を集めて、これを思いつきました。主に、FCOアプローチを使用したモデリングの演習として。したがって、ここにいくつかのステートメントがあります。それぞれにtrueまたはfalseのフラグを立てることができるはずです。

  • 遺伝子は、DNAの一部に付けられた名前です。
  • 遺伝子は染色体上の特定の位置を占めます。
  • 染色体は、多くの遺伝子を含む単一のコイル状のDNAです。
  • 対立遺伝子は、単一遺伝子の複数の代替形態の1つです。
  • 対立遺伝子は遺伝子です。
  • バリアントDNAシーケンスです。
  • バリアントは遺伝子にまたがっています。
  • バリアントは対立遺伝子にまたがっています。
  • 遺伝子型対立遺伝子の2つのコピーです。
  • 表現型は、人の観察可能な特性です。
  • 遺伝子型は表現型に影響を与えます。
  • 1つの表現型は多くの遺伝子型の影響を受ける可能性があります。
  • 1つの遺伝子型が多くの表現型に影響を与える可能性があります。
  • には多くの遺伝子型があります。
  • は多くの観察された表現型を持っています。
  • バリアントはの中で発見することができます。

ここに画像の説明を入力してください

于 2012-06-30T00:14:05.640 に答える