私はPythonの初心者ですが、他の言語でしばらくプログラミングしました。DNA (小文字) と AA シーケンス (大文字) の長い文字列があります。さらにファイルの先頭には、すべて大文字のタンパク質名があります。したがって、私のファイルは次のようになります。
PROTEINNAMEatcgatcg... JFENVKDFDFLK
文字列内の最初の大文字以外の文字を見つけて、タンパク質名を切り出す必要があります。したがって、私が上記から望むことは次のとおりです。
atcgatcg... JFENVKDFDFLK
ループでこれを行うことができますが、それはやり過ぎで非効率的です。それを行うための単純なpythonの方法はありますか?
re.findall("[AZ]",mystring) を使用してすべての大文字を取得できますが、結果が元の文字列とどこが異なるかを確認するために比較を行う必要があります。
ありがとう!