Kuidas määrata DNA järjestuse GC-sisu

DNA järjestuse guaniini-tsütosiini sisaldus või GC-sisaldus näitab nukleotiidi aluspaaride protsenti, kus guaniin on tsütosiiniga seotud. Suurema GC-sisaldusega DNA-d on raskem lahti murda.

1
Jälgige järjestust ja loendage tsütosiini (C) või guaniini (G) nukleotiidide arv.

2
Jagage tsütosiini ja guaniini nukleotiidide arv järjestuse aluspaaride koguarvuga.

3
Looge või aktsepteerige sisendfail. See artikkel eeldab, et sisend on FASTA-vormingus ja faili kohta on üks jada.

4
Lugege failist. FASTA vormingu puhul: loobuge faili esimesest reast.Eemaldage kõik ülejäänud reavahetused ja muud tühikud.def init(sequence): sisendiks open(argv[1]): järjestus = “”.join([line.strip( ) rea jaoks input.readlines()[1:]]) tagastusjada

5
Loo loendur. Korrake andmeid ja suurendage loendurit, kui leiate guaniini või tsütosiini nukleotiidid.

6
def GCcontent(järjestus): GCcount = 0 tähe jaoks järjestuses: kui täht == “G” või täht == “C”: GCcount += 1 tagastab GCcount

7
Jagage GC arv jada kogupikkusega ja väljastage tulemus protsentides.

8
def main(): skript, sisend = argv järjestus = “” järjestus = init(järjestus) print “%.2f” % (float(GCcontent(sequence)) / len(sequence))