Ich möchte Länge einzelner Sequenzen in einer Multifasta-Datei bestimmen. Ich habe diesen biopython Code aus dem Bio-Handbuch als:berechnen Sie die Länge einer Sequenz nach dem Hinzufügen der Länge der vorherigen Sequenzen
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):
output_line = '%s\t%i' % \
(seq_record.id, len(seq_record))
print(output_line)
Meine Eingabedatei ist wie:
>Protein1
MNT
>Protein2
TSMN
>Protein3
TTQRT
Und der Code ergibt:
Protein1 3
Protein2 4
Protein3 5
Aber ich will die Länge berechnen einer Sequenz nach dem Hinzufügen der Länge der vorherigen Sequenzen. Es wäre wie:
Protein1 1-3
Protein2 4-7
Protein3 8-12
Ich weiß nicht, in welcher der oben genannten Zeile im Code, die ich ändern müssen, um diese Ausgabe zu erhalten. Ich würde mich über jede Hilfe bei diesem Thema freuen, danke !!!!
Excellent .. Vielen Dank u sehr viel .. nur einen Tippfehler zu erwähnen, in 'previos' und ein extra ')' .. Danke – user2300042