“genbank”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

945 参照

java - GenBank形式ファイルのFASTA形式への変換

私は Java の初心者で、GenBank テキストファイルを FASTA 形式に変換できるプログラムを構築したいと考えています。基本的に 2 つのテキストボックスがあります。1 つは GenBank 形式のファイルをアップロードする場所、もう 1 つは変換された FASTA 形式のファイルを表示する場所です。

これは GenBank 形式のファイルです。

対応する FASTA 形式のファイルは次のとおりです。

GenBank ファイルをトリミングし、クリックしたボタンを使用して 2 番目のテキストボックスに表示する方法やコードに関するアドバイスを手伝ってくれる人はいますか。

Netbeans 6.9 を使用しています。

2012-09-06T15:46:44.047

0 投票する

1 に答える

338 参照

perl - genbank形式から配列を引き出す

このコードは正常に動作していましたが、今度は不平を言います。genbank 構造は変更されましたか?

perl bioinformatics bioperl genbank

2013-06-26T14:04:50.060

0 投票する

1 に答える

2161 参照

r - Genbank クエリ (パッケージ seqinr): シーケンスの説明で検索

Genbank からミオグロビン DNA 配列をダウンロードするためquery()にパッケージの機能を使用しています。seqinr例えば：

残念ながら、私が探している多くの種については、配列がまったく得られません (または、この種については、非常に短いものだけです)。ウェブサイトで手動で検索すると配列が見つかります. これは、キーワードに「ミオグロビン」のみを検索するためです。多くの場合、そこにはエントリがありません。多くの場合、タンパク質の種類は名前 (Genbank の「定義」) でのみ指定されますが、これを検索する方法がわかりません。のヘルプページにquery()は、詳細なオプションが提供されていないようです.「K =」を使用しない「一般的な検索」は機能せず、グーグルで検索しても何も見つかりませんでした.

リンク、説明、ヘルプをいただければ幸いです。ありがとうございました！:)

r genbank

2013-07-15T16:14:29.960

0 投票する

2 に答える

2129 参照

python - GenBank ファイルの解析: ローカスタグとプロダクトの取得

基本的に、GenBank ファイルは、以下に示す 2 つのように、遺伝子エントリ (「遺伝子」とそれに続く対応する「CDS」エントリ (遺伝子ごとに 1 つだけ) で発表されます。タブ区切りで locus_tag と製品を取得したいと思います。 2 列のファイル 'gene' と 'CDS' の前後には必ずスペースが入ります。

前の質問でスクリプトが提案されました。

問題は、「product」の名前に「/」文字が含まれていることがあるため、このスクリプトと競合しているように見えることです。これは、私が理解できる限り、「/」をフィールドセパレーターとして使用して情報を配列？

このスクリプトを変更するか、別のスクリプトを作成して、これを解決したいと思います。

python perl parsing bioperl genbank

2014-02-27T11:55:37.547

0 投票する

1 に答える

1851 参照

python - SeqIO:「ハンドルにレコードが見つかりません」

Python と BioPython を使い始めたばかりで、プログラミングの経験があまりありません。皆さんの助けがあれば幸いです。

genbank から CDS および/または rRNA 配列を抽出しようとしています。オープンリーディングフレームのみを取得することが重要です。そのため、シーケンス全体を取得するだけではありません. 以下のコードを実行すると、次のようなエラーが表示されます。

ハンドルにレコードが見つかりません

次のコード行の場合: record = SeqIO.read(handle, "genbank"). この問題を修正する方法がわかりません。以下に使用しているコードを含めました。

また、これを行う簡単な方法や公開されたコードがあれば、教えていただければ幸いです。

ありがとう！

python bioinformatics biopython genbank

2014-03-25T17:55:38.920

0 投票する

1 に答える

565 参照

python - ゲノム配列のないGBKファイルを解析するBiopython

私は、GenBank ファイルと Biopython を使用して GBK ファイルのシーケンス部分から特定の遺伝子のシーケンスを取得するスクリプトを作成しました。これは私の同僚が仕事に使用しています。

新しいデータセットでいくつかの問題が発生し、ダウンロードされた GBK ファイルに配列が含まれていないことが判明しました (これは、NCBI の GenBank Web サイトからダウンロードすると簡単に発生する可能性があります)。を使用すると、エラーをスローする代わりに、Biopython は N の長いシーケンスを返しますrecord.seq[start:end]。その問題を最初から見つけてスクリプトを停止し、エラーメッセージを表示する最も簡単な方法は何ですか?

python biopython genbank

2014-08-28T14:35:10.993

0 投票する

1 に答える

161 参照

smalltalk - ディスクからgenbankファイルを読み取ってfastaに変換するのを手伝ってください

biosmalltalk (Pharo 版) を使用して、GenBank 配列を同等の FASTA 形式に変換する方法を教えてください。ディスクから GenBank ファイルを読み取る方法は既にわかっています。ファイル xym | x:=時間ミリ秒クロック値。ファイル := BioFile on: (FileStream readOnlyFileNamed: BioObject testFilesDirectoryName asFileReference / 'AF165912.gbk')。m:=BioParser tokenizeMultiFasta: ファイルの内容。y:=時間ミリ秒ClockValue. トランスクリプトを開きます。転写クリア。Transcript show:m;cr. 今、私はそれに相当する FASTA を取得したいと考えています。

smalltalk pharo fasta genbank

2014-09-26T09:53:36.320

0 投票する

2 に答える

193 参照

regex - 正規表現を使用して単一行文字列の文字長を変更する

60 塩基 (末尾に \n がある) の単一行の文字列で構成される genbank ファイルからシーケンスを抽出しました。perl を使用してシーケンスを変更し、bioperl ではなく正規表現を使用して各行に 120 塩基を出力する方法。元の形式:

私はそれらを60文字の長さの文字列にすることしかできませんでした。それらを120文字の長さにする方法をまだ見つけようとしています。

}

入力例:

これは、1 つの線ストリングごとに 60 塩基を持ちます。

更新 (まだ 120 塩基長の seq 行を提供していません):

regex perl bioinformatics genbank

2014-10-17T19:24:22.437

問題タブ [genbank]

Reference