私はバイオインフォマティクスでいくつかの研究を行っており、Matlab を使用しています。Matlab には多くの強力なツールがあり、使いやすかったです。私はゲノム配列決定と代謝経路の予測について考えました。他の人が一番いいと思うものは何だろう?または、1 つの特定の言語ではなく、数学が重く大量のデータを扱うバイオインフォマティクスの作業に最適な言語がいくつかある場合があります。
7 に答える
BioStar の次のスレッドに興味があるでしょう。
私たち生物情報学者のほとんどにとって、これには Python、R、Perl、および bash コマンド ライン ユーティリティ (sed、awk、cut、sort など) が含まれます。Java、Ruby、C++、Matlab でコーディングしている人もいます。
結論は?最も簡単に作業を完了できる言語は、あなたにとって最適な言語です。この質問への回答には、プルできるライブラリやその他のコードの慎重な調査、および自分の好みや経験に関する情報が含まれている必要があります。マイクロアレイ解析を行っている場合、R/bioconductor ライブラリに勝るものはありませんが、大規模なシーケンス データ セットのほとんどの種類を扱う人にとって、それは絶対に間違った言語です。
バイオインフォマティクスに適した言語はありません。
重要なBLASTシーケンス ツールは C++ で記述されています
タンパク質構造を整列させるためのMATTツールは C で書かれています。
計算生物学の同僚の何人かは Ruby を使用しています。
一般に、パフォーマンスが重要なコードには多くの C および C++ が使用され、それ以外の場合には多くのスクリプト言語が使用されます。
Python + scipy はまともです (そして無料です)。
http://www.vetta.org/2008/05/scipy-the-embarrassing-way-to-code/
Matlab を SciPy にドロップする場合、新しい構文を実際に学習する必要さえありません。
良くも悪くも、SAS はバイオ医薬品の事実上のプログラミング環境です。世界のファイザー、メルク、バイエルでバイオインフォマティクスの仕事をするのであれば、SAS のスキルを身につけたほうがよいでしょう。SAS プログラマーは非常に需要があります。
「最良の」言語は主観的であり、タスクごとに異なる可能性がありますが、バイオインフォマティック作業では、個人的にR、Perl、Delphi、Cを使用します(これらのいくつかの組み合わせが非常に頻繁にあります)。
私は主にHMMとタンパク質配列を扱っています。私はCで書き始めましたが、その後Pythonに切り替えて満足しています。何かをすばやくプロトタイプ化する方が簡単で、コードの保守も簡単になると思います。
これは、さまざまな言語をさまざまな状況で評価する主題について書かれた無料で入手できる学術論文です: http://www.biomedcentral.com/1471-2105/9/82
彼らは、6 つの一般的に使用される言語を 3 つの異なるレベルにグループ化しました。
2 compiled languages: C, C++
2 semi-compiled languages: C#, Java
2 interpreted languages: Perl, Python
いくつかの一般的な結論:
- コンパイルされた言語は、グローバル アラインメントと近隣結合プログラムでインタープリター言語よりも優れていました。
- 一般に、解釈された言語はより多くのメモリを使用しました
- Python を除いて、すべての言語は BLAST 計算でほぼ同じように実行されました
- コンパイルされた言語では、同じタスクを実行するために、より多くの記述されたコード行が必要です
- コンパイルされた言語は、アルゴリズムの実装に適している傾向があります
- 解釈された言語は、ファイルの解析/操作に適している傾向があります
バイオインフォマティクスのスキルを構築する方法について議論している別の優れた無料の学術記事を次に示します。