The Journal of Visualized Experiments (JoVE) is a peer reviewed, PubMed-indexed video journal. Our mission is to increase the productivity of scientific research.
This translation into Dutch was automatically generated through Google Translate.
English Version | Other Languages
Department of Medicine, University of Toledo Health Science Campus
Prakash, A., Bechtel, J., Fedorov, A. Genomic MRI - a Public Resource for Studying Sequence Patterns within Genomic DNA. J. Vis. Exp. (51), e2663, doi:10.3791/2663 (2011).
Niet-coderende genomische regio's in complexe eukaryoten, waaronder intergenische gebieden, introns, en de onvertaalde segmenten van exonen, zijn diep niet-willekeurige in hun nucleotide samenstelling en bestaan uit een complex mozaïek van sequentie-patronen. Deze patronen zijn onder de zogenaamde middenklasse inhomogeniteit (MRI) regio's - sequenties 30-10000 nucleotiden in lengte die zijn verrijkt met een bepaalde basis of een combinatie van basen (bv. (G + T)-rijke, purine-rijke, etc. ). MRI's worden geassocieerd met ongewoon (niet-B-vorm) DNA-structuren die vaak betrokken zijn bij de regulatie van genexpressie, recombinatie, en andere genetische processen (Fedorova & Fedorov 2010). Het bestaan van een sterke fixatie vooroordeel binnen MRI's tegen mutaties die de neiging hebben te verminderen de volgorde inhomogeniteit bovendien de functionaliteit en het belang van deze genomische sequenties (Prakash et al.. 2.009) ondersteunt.
Hier laten we zien een vrij beschikbare Internet-bron - het Genomic MRI-programma pakket - (. Bechtel et al. 2008) ontworpen voor computationele analyse van de genomische sequenties in om uit te vinden en verschillende MRI-patronen karakteriseren in hen. Dit pakket maakt het ook mogelijk generatie van gerandomiseerde sequenties met verschillende eigenschappen en het niveau van correspondentie aan de natuurlijke ingang DNA-sequenties. Het belangrijkste doel van deze bron is het vergemakkelijken van het onderzoek van grote delen van niet-coderend DNA die nog nauwelijks zijn onderzocht en wachten op een grondige verkenning en erkenning.
Alle gebruikte programma's in de krant zijn geschreven met behulp van perl, en alle webpagina's zijn gemaakt met behulp van PHP.
1. Startpunt:
Open de homepage van de online Genomic MRI-pakket op http://mco321125.meduohio.edu/ ~ jbechtel / gmri /. Het web bron geeft ook instructies / uitleg over de programma's in de "Help (How-to/README)" link, terwijl alle gepubliceerde materialen op genomic MRI en soortgelijke algoritmen zijn opgenomen in de "Links naar relevante bronnen" link.
2. Voorbereiding en uploaden van Input Sequence (s).
Maak een bestand met FASTA-geformatteerde sequentie (s) om een GMRI analyse sessie te starten. Elke nucleotidesequentie in dit formaat moet worden voorafgegaan door een enkele lijn te beginnen met de '>' karakter dat een identifier vertegenwoordigt, gevolgd op dezelfde lijn door een korte beschrijving van deze reeks. Nucleotide-sequenties voor GMRI analyse ook personages als R, Y, N, X, etc. Hwever, non-A, T, C het toelaat, zal G tekens die niet worden verwerkt door het programma en zal worden overgeslagen. Sequenties in die repetitieve elementen zijn "gemaskeerd" (vervangen door "N" s) kan worden gebruikt als input. Merk op dat reeks tekens zijn niet hoofdlettergevoelig.
LET OP: Voortaan de input sequenties worden aangeduid als "userfile".
3. Krijgen een Oligonucleotide frequentieverdeling van de Input sequenties (optioneel).
Klik op de "SRI Analyzer" tab (bovenste rij) om een verdeling van de oligonucleotide frequenties voor de gehele set van input sequenties te krijgen. De afkorting SRI staat voor korte afstanden inhomogeniteit. Op dit moment, kan de gebruiker de hoogste lengte van de oligonucleotiden (van 2 tot 9 nucleotiden, standaard 6 gen) voor welke frequenties zal worden berekend. Deze selectie wordt gemaakt door te klikken op de gewenste optie in het "Maximum oligomeer size" keuzelijst. Druk vervolgens op de "Analyze File" knop om de berekening te starten. Een ruwe weergave van de inputsequentie samenstelling verschijnt onmiddellijk als een korte tafel in het midden van deze webpagina en downloadbare als "userfile.comp.tbl". Deze tabel geeft alleen de meest en de minst overvloedige oligonucleotiden in de input sequenties.
De gehele frequentie tabel voor alle mogelijke oligonucleotiden wordt gegenereerd als een bestand met de naam "userfile.comp", die verkregen kan worden via de "Download samenstelling file" link.
LET OP: SRI analyzer telt de hele verzameling van alle overlappende oligonucleotiden.
4. Genereer willekeurige reeksen met dezelfde Oligonucleotide samenstelling als in de Input Sequences (optioneel).
(Voltooiing van stap 3 van het protocol is nodig voor deze taak).
5. Analyse van de Mid-Range inhomogeniteit (MRI) van de Input en Random sequenties.
6. Aanvullende programma's binnen de Genomic MRI Package (optioneel).
Het Genomic MRI bron heeft ook twee geavanceerde opties voor het genereren van zeer specifieke willekeurige sequenties. Ze zijn verkrijgbaar via de "MRI-Generator" en "CDS Generator 'tabs in de bovenste rij.
7. Representatieve resultaten
Dit protocol kan een gebruiker te studeren compositorische inhomogeniteit van nucleotidesequenties. Belangrijker nog, het ondersteunt ook het genereren van een groot aantal gerandomiseerde sequenties met een oligonucleotide samenstelling nagenoeg overeenkomt met die van de input sequenties. Meestal genomische sequenties van complexe eukaryoten niet homogeen van samenstelling, maar vormen een complex mozaïek van sequentie segmenten verrijkt met bepaalde nucleotiden (bijvoorbeeld, purine-rijke, (G + T)-rijk, (A + T)-rijke, enz.). Deze patronen bij mid-range schaal (30 tot 1.000 bp) worden gevisualiseerd door de grafische output van MRI-analyzer die content-rijke segmenten shows geselecteerd als bovenste blauwe pieken en content-arme segmenten als onderste rode spikes (zie de figuren 1 en 2). Typisch, het aantal van een content-rijke en content-arme regio's in een natuurlijke volgorde (figuur 1) is in de orde van malen hoger dan het aantal van dezelfde soorten van regio's in overeenkomstige gerandomiseerde sequenties (figuur 2) met dezelfde oligonucleotide samenstelling. Deze volgorde segmenten met mid-range inhomogeniteit in nucleotide samenstelling van belang kan zijn voor de gebruiker. Ze zijn verkrijgbaar bij de Genomic MRI-output bestanden voor verder onderzoek.

Figuur 1. Een voorbeeld van de MRI-analyzer grafische uitvoer van stap 5.7. De resultaten zijn verkregen op een steekproef van 44 mensen introns. Blauwe balken vertegenwoordigen posities van GC-rijke regio's langs deze introns. Rode staven geven GC-arme (of AT-rijk) MRI regio's. De y-as bevat boven-en lagere drempels voor de gegeven content type.

Figuur 2. MRI analyzer uitgang voor de willekeurige volgorde "userfile.rand1_4".
De Graphische voorstelling van MRI in een willekeurig gegenereerde reeks met behulp van het SRI-generator-programma.

Figuur 3. Een voorbeeld van het begin van een tekstuele output file van MRI-analyzer.
Alle content-rijke en content-armen sequenties gedetecteerd door het programma worden gepresenteerd in de laatste (vierde) kolom. Hun relatieve posities, gemeten in het aantal ramen, worden getoond in de eerste kolom. De tweede en derde kolom zijn indicatoren voor content-rijke en content-arme regio's, respectievelijk.
Regio's met niet-homogene samenstelling nucleotide op mid-range schalen (30 tot 1,000 nucleotiden) zijn overvloedige in het genoom van complexe eukaryoten en kan overal worden gevonden (intergene regio's, introns, onvertaalde regio's van exonen, repetitieve elementen). Deze regio's worden vaak geassocieerd met ongebruikelijke DNA conformaties. Bijvoorbeeld, purine-/pyrimidine-rich sequenties hebben de neiging om DNA triplexes (H-DNA) vorm; sequenties met afwisselende purine / pyrimidinebasen worden geassocieerd met Z-DNA conformaties; (G + C) gebieden met een rijke vertonen structurele afwijkingen in de B- DNA en kan worden vatbaar voor backbone decollete; (A + T)-rijke regio's zouden kunnen vormen een ongebruikelijke structuur - een DNA-element ontspanning, enz. (beoordeeld door Fedorov & Fedorova 2010). Sommige van deze mid-range patronen (bv. (G + T)-rijke regio's) zijn nauwelijks onderzocht en nog steeds wachten op een grondige verkenning en erkenning. Het belangrijkste doel van onze Genomic MRI web bron is om gebruikers te helpen bij de identificatie van deze MRI regio's voor hun verdere experimentele analyse en verkenning van hun mogelijke functies. Kennis van de MRI regio's kunnen worden opgenomen in en het verbeteren van de nieuwe generatie van gen-voorspeller programma's (Shepard 2010) en ons begrip van genoom functies en eigenschappen.
Geen belangenconflicten verklaard.
Wij zijn dankbaar voor Samuel Shepard, Peter Bazeley, en John David Bell voor het beheer van de Genomic MRI-webpagina's. Dit werk werd ondersteund door National Science Foundation Career Award "Onderzoek van intron cellulaire rollen" [subsidie aantal MCB-0643542].
| Name | Company | Catalog Number | Comments |
| Computer with Internet | |||
| Files with nucleotide sequences for examination |