Ist es möglich, aus einer komprimierten Datei (z. B. FASTA bz2) zu lesen? Normalerweise verwende ich skbio.sequence.Sequence.read, sehe aber diese Option dort nicht.Lesen von komprimierten FASTA bz2-Datei mit skbio
Danke!
Ist es möglich, aus einer komprimierten Datei (z. B. FASTA bz2) zu lesen? Normalerweise verwende ich skbio.sequence.Sequence.read, sehe aber diese Option dort nicht.Lesen von komprimierten FASTA bz2-Datei mit skbio
Danke!
Dies ist möglich, zu tun, wie folgt:
import skbio
seq = skbio.io.read("seqs.fna.bz2", format='fasta', compression='bz2', into=skbio.DNA)
I scikit-bio 0.5.0 bin mit, aber dies sollte auch mit früheren Versionen möglich sein. Während ich explizit den Komprimierungstyp definiere, ist das im Allgemeinen nicht notwendig. Die entsprechende Dokumentation lautet here und here.
Ein paar Dinge zu beachten: 1) Das obige Beispiel verwendet die prozedurale API. Sie können dazu äquivalent die objektorientierte API verwenden, z. 'skbio.Sequence.read (" seqs.fna.bz2 ")'. 2) scikit-bio versucht, den Komprimierungstyp und das Dateiformat zu erraten, unabhängig von den verwendeten Dateierweiterungen. – jairideout
Wie funktioniert das mit mehr als einem Eintrag in der Datei? –
Ich bin auf der Suche nach einem Skbio-Ersatz für SeqIO.parse (z. B. mit bz2.BZ2File (fna_bz2, "r") als in_f: für s in SeqIO.parse (in_f, "Fasta") :) Danke! –