2016-06-23 20 views

Antwort

2

Dies ist möglich, zu tun, wie folgt:

import skbio 
seq = skbio.io.read("seqs.fna.bz2", format='fasta', compression='bz2', into=skbio.DNA) 

I scikit-bio 0.5.0 bin mit, aber dies sollte auch mit früheren Versionen möglich sein. Während ich explizit den Komprimierungstyp definiere, ist das im Allgemeinen nicht notwendig. Die entsprechende Dokumentation lautet here und here.

+1

Ein paar Dinge zu beachten: 1) Das obige Beispiel verwendet die prozedurale API. Sie können dazu äquivalent die objektorientierte API verwenden, z. 'skbio.Sequence.read (" seqs.fna.bz2 ")'. 2) scikit-bio versucht, den Komprimierungstyp und das Dateiformat zu erraten, unabhängig von den verwendeten Dateierweiterungen. – jairideout

+0

Wie funktioniert das mit mehr als einem Eintrag in der Datei? –