Sådan bestemmer du gc-indholdet af en dna-sekvens
Guanin-cytosinindholdet eller GC-indholdet af en DNA-sekvens angiver procentdelen af nukleotidbasepar, hvor guanin er bundet til cytosin. DNA med et højere GC-indhold vil være sværere at bryde fra hinanden.
Trin
Metode 1 af 2:
Med hånden1. Spore gennem sekvensen og tally antallet af cytosin (C) eller guanin (g) nukleotider.

2. Opdel antallet af cytosin og guanin nukleotider med det totale antal basepar i sekvensen.
Metode 2 af 2:
Programmatisk (Python 2)1. Opret eller accepter en inputfil. Denne artikel forudsætter, at input er i FASTA format, med en enkelt sekvens pr. Fil.

2. Læs i filen. Til FASTA-format:
Def init (sekvens): med åben (argv [1]) som input: sekvens = "".Deltag ([linje.Strip () til linje i input.Readlines () [1:]]) Retursekvens

3. Opret en tæller. Iterere gennem dataene og øge din tæller, når du støder på guanin eller cytosin nukleotider.
4
Def Gccontent (sekvens): gccount = 0for brev i rækkefølge: Hvis bogstav == "G" eller bogstav == "C": GCCOUNT + = 1RETURN GCCOUNT

5. Opdel GC-tællingen med den samlede længde af sekvensen, og udsend resultatet i procentformat.
6
Def Main (): script, input = argvsequence = ""sekvens = init (sekvens) print "%.2f" % (float (gccontent (sekvens)) / len (sekvens))
Tips
Hvis du beregner GC-indhold med hånden, skal du sørge for at dobbelttjekke! Det kan være let at miscount, især hvis du analyserer en lang sekvens på papir.
Del på sociale netværk :