バイオインフォマティクスの作業に最適なオペレーティング システムはどれですか? ほとんどのツールは 64 ビット Windows 用ですか、Linux/Unix 一般用ですか、それとも OS X 用ですか?
14 に答える
バイオインフォマティクスは依然としてテキストファイル処理に大きく依存している分野であり、このLinuxには多くのコアユーティリティが用意されています。いくつかの必須アイテムは、 cat、sed、cut、paste、grepに加えて、もちろんプリインストールされたperlおよびpythonインタープリターです。さらに、R(統計計算用)のようなソフトウェアには、Linuxではメモリ制限がありません(Windowsでは、セキュリティ上の理由から、使用可能なRAMのパーセンテージに制限されています)。
生体情報については、Linux が適していますが、データ分析を行うには何らかのソフトウェアが必要になる可能性があります。たとえば、私の場合、adobe illustrator を使用して、スクリプトを介して生成されたベクター グラフィックス イメージを改善する必要がありました。その場合、完全な Linux セットアップは私にとって悪いことでした。
サーバーと実行中のプログラム (バイオインフォ コミュニティが perl を好むため、ほとんどが perl スクリプト) については、Linux を強く推奨します。他の Unix は時代遅れであるか、すぐになくなるでしょう。
したがって、互換性を高めるために、サーバーに Linux を使用し、ラップトップに別の Unix を使用することをお勧めします。デスクトップに適した Unix ソリューションは MacOSX だけなので、それがあなたの質問に対する答えです。
最近、MacBookへの大きな移行に気づきました。最近のカンファレンスでは、MacBookがLinuxやWindowsのラップトップを追い抜いています。Macラップトップの利点は、万が一パッケージが利用できない場合に、finkなどを使用してシェル内のラップトップですべてのLinux作業を実行できることです。そして、実際にラップトップを使用して、他のコア以外の作業を行うことができます。WindowsアプリケーションはParallelsまたはVMFusionを使用しており、Unityなどの機能を備えているため、完全なWindowsVMを実行する必要はありません。
デスクトップ側では、おそらくまだLinuxをお勧めします。これは、任意の種類のサーバーインフラストラクチャを開発する場合、展開環境も常にLinuxであるためです。サーバー上のRedHatは、アカデミック環境で人気があります。ただし、これは以前ほど大したことではなく、Macベースのデスクトップもたくさん見られます。また、ラップトップを開発に使用する人が増えていることにも注目しています。
ほとんどすべてのバイオインフォマティックソフトウェアはLinuxで利用できます(したがって、通常はMacで動作します)。Linuxでは利用できないバイオインフォマティクスのプログラムをまだ見つけていません-そのほとんどすべてがオープンソースです。Macの主な利点は、Illustratorのようなプレゼンテーションやプログラム用の優れたソフトウェアです。LaTeXは、原稿を書くためのMacでも十分にサポートされており、Wordは、オタク以外の人とドキュメントを共有するためにネイティブに機能します。
perlやpython(バイオインフォマティクスの共通語)のようなスクリプト言語はMacで十分にサポートされており、Linuxには多くのバージョンがあることを覚えておく必要があります。同じスクリプトを異なるバージョンのLinuxで実行するには、いくつかの作業が必要になる場合があります。
生物学研究室のほとんどの学生とポスドクは、Mac と OS/X を使用しています。主流のプラットフォームです。通常、バイオインフォマティクスのタイプはよりコンプサイエンス指向ですが、コンプサイエンスにはあまり関心のない生物学者や生物工学者と連携する必要があります。バイオインフォマティクス カンファレンスでどの OS/S を実行しているかを数えてみてください。最も人気があるのは OS/X です。多くのバイオインフォマティクス ツールは Perl または Java で記述されており、Python の普及が進んでいます。これらは POSIX オペレーティング システム用に作成された多数のサード パーティ製ライブラリを備えた POSIX 指向の言語であるため、Windows を選択するのはあまり良い選択ではありません。ただし、バイオロボティクスなどの機器制御用の商用アプリケーションのほとんどは、主に Windows 用に作成されています。
Ubuntu のような一般的な Linux ディストリビューションを使用している場合は、Perl と (私が思うに) Python が最初に読み込まれます。これらはバイオインフォマティクスで使用される一般的な言語であり、優れたライブラリがいくつかあります (Bioperl/biopython/CPAN/etc)。
また、私は使ったことはありませんが、DNALinuxはこの種のもののために作られました。
この分野のプレーヤーの多くは大学であり、多くの大学が Linux を使用しているので、それは私の推測です。私が修士課程で Linux を使用していた学校のバイオインフォマティクス部門を知っています。
おそらく「最高の」OS ではないかもしれませんが、世の中にはたくさんの Windows ソフトウェアがあります。製薬会社で働いていたので、SAS、SPlus、StatXact、NQuery などを見てきました。
とはいえ、Linux への移行はますます進んでいます。たとえば、R プログラミングは複数の OS で利用できます。エンドユーザーがシステムに慣れているため、浸透が遅いと思われます。
Mac OS X、仮想マシンに Windows をインストールでき、Unix です。次に、Linux のすべての利点 (パッケージ管理プログラムの「ポート」を使用)。
ちょうど私のUSD 0.02。
Unix システムは昔から科学分野で人気があるため、FORTRAN を使用する予定がある場合は特に Linux をお勧めします。Windows を試すこともできますが、Windows API は正確にはプログラマー向けではなく、C# (ほとんどのアプリケーションでは非常に高速ですが) はおそらく科学計算には遅すぎます。F# は科学には非常に優れていますが、複雑な計算に十分な速度があるかどうかはわかりません。
C++、STL、および Qt や wxWidgets などのプラットフォームに依存しない GUI ツールキットも使用できると思います。この方法では、プラットフォームについて (それほど) 心配する必要はありません。
私は大学でバイオインフォマティクスのコースを受講し、Windows、Linux、Solaris、およびいくつかの Web ベースのツールでさまざまなツールを使用しました。
簡単に言えば、上記のいずれかにアクセスする必要があるということです。WindowsまたはLinuxだけで対処できるはずですが。そのプラットフォームで利用できるツールに制限されるだけです。
私の経験では (ざっくりですが)、バイオインフォマティクスのツールは通常、perl または Java で記述されています。最近では Python を使用しているため、ほとんどプラットフォームに依存しません。
C で記述されるいくつかのツールがあるため、それらを使用するには、ビルドされたプラットフォームが利用可能であるか、選択したプラットフォーム用のビルドを見つける必要があります。
Windows は良い選択です。AnnHyb、MeltSim、Base Pad、Winblast など、かなり標準的なアプリがたくさんあります。
Linuxを見てください!! これは単なるオペレーティング システムではなく、すべての部分 (カーネルからさまざまなプログラムまで) が人々のコミュニティによって作成および維持されるソフトウェア プロジェクトです。
Linux を長期間 (1 年か 2 年) 使用すると、人々のコミュニティで生きて貢献する方法を学ぶことができます。これは科学者にとって非常に役立ちます。
技術的な観点から見ると、Linux は Unix システムの無料のクローンです。これは、フラット ファイルを管理するための多くのツール (sed、awk) とともに、コマンド ライン (bash) での作業が適切にサポートされていることを意味します。 、grep) を使用すると、テキスト ファイルを直接開かなくても操作を実行できます。さらに、システムにインストールされているプログラムを管理し、クリック 1 つで新しいプログラムをダウンロードしてインストールできる優れたツールがあります。いくつかの高度なプロプライエタリ プログラムが欠けているかもしれませんが、その一方で、優れたドキュメントを備えた多くの無料ツールがあります。
私は Linux を 4 年間使用していますが、他のオペレーティング システムが恋しいということはまったくありません。
バイオインフォマティクスや同様の分野では、通常、複数のホスト/ゲスト/ターゲット OSを含むツールセットの中から選択します。作業する OS は、主にどこでどのように作業するかによって異なります。
私は、純粋な Linux から「純粋な」Windows (hel-lo Cygwin) まで、さまざまな作業環境で作業してきました。私は Mac OS X で作業したことはありませんが、Mac OS X だけで作業している人も知っています。
幅広い配布用に FOSS アプリを開発する場合は、Linux、ANSI C、Perl/Python、Apache/MySQL (つまり LAMP スタック) が最適です。さらに、Windows 用の同様の「WAMP」スタックがあり、Cygwin を使用すると、Linux で開発された多くのツールをコンパイルして使用できます。私の知る限り、多くの Linux アプリは Mac OS X でもビルド/実行できます。
データ分析/視覚化の場合、一般的な商用ツールや多くの OSS ツールでさえ、ネイティブ バージョンまたは Java バージョンのWindowsで実行されます。したがって、おそらく最適なセットアップは、ネイティブの Windows XP マシンと、Linux の実/仮想インスタンスへの [xhosted] アクセスです。