Sådan bestemmer du gc-indholdet af en dna-sekvens

Guanin-cytosinindholdet eller GC-indholdet af en DNA-sekvens angiver procentdelen af ​​nukleotidbasepar, hvor guanin er bundet til cytosin. DNA med et højere GC-indhold vil være sværere at bryde fra hinanden.

Trin

Metode 1 af 2:
Med hånden
  1. Billede med titlen 7114843 1
1. Spore gennem sekvensen og tally antallet af cytosin (C) eller guanin (g) nukleotider.
  • Billede med titlen 7114843 2
    2. Opdel antallet af cytosin og guanin nukleotider med det totale antal basepar i sekvensen.
  • Metode 2 af 2:
    Programmatisk (Python 2)
    1. Billede med titlen 7114843 3
    1. Opret eller accepter en inputfil. Denne artikel forudsætter, at input er i FASTA format, med en enkelt sekvens pr. Fil.
  • Billede med titlen 7114843 4
    2. Læs i filen. Til FASTA-format:
  • Kassér den første linje i filen.
  • Fjern alle de resterende newlines og andet efterfølgende hvide rum.
  • Def init (sekvens): med åben (argv [1]) som input: sekvens = "".Deltag ([linje.Strip () til linje i input.Readlines () [1:]]) Retursekvens
  • Billede med titlen 7114843 5
    3. Opret en tæller. Iterere gennem dataene og øge din tæller, når du støder på guanin eller cytosin nukleotider.
  • 4
    Def Gccontent (sekvens): gccount = 0for brev i rækkefølge: Hvis bogstav == "G" eller bogstav == "C": GCCOUNT + = 1RETURN GCCOUNT
  • Billede med titlen 7114843 6
    5. Opdel GC-tællingen med den samlede længde af sekvensen, og udsend resultatet i procentformat.
  • 6
    Def Main (): script, input = argvsequence = ""sekvens = init (sekvens) print "%.2f" % (float (gccontent (sekvens)) / len (sekvens))

    Tips

    Hvis du beregner GC-indhold med hånden, skal du sørge for at dobbelttjekke! Det kan være let at miscount, især hvis du analyserer en lang sekvens på papir.
    Del på sociale netværk :
    Lignende