MR Genomik - Sıra Desenler Genomik DNA içinde incelenmesi için Kamu Kaynak

Biology
 

Summary

Biz genom dizilerinin analizi için genel bir hesaplama web sitesi mevcut. DNA dizisi modelleri, çeşitli tesadüfi olmayan bir nükleotid kompozisyonlar ile algılar. Bu kaynak da, farklı karmaşıklık düzeylerine sahip randomize dizileri üretir.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Prakash, A., Bechtel, J., Fedorov, A. Genomic MRI - a Public Resource for Studying Sequence Patterns within Genomic DNA. J. Vis. Exp. (51), e2663, doi:10.3791/2663 (2011).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Sigara kodlama intergenic alanları intronlar ve ekzonlarının çevrilmemiş kesimleri de dahil olmak üzere karmaşık ökaryotlar, genomik bölgelerde kendi nükleotid kompozisyon derinden tesadüfi olmayan ve karmaşık bir dizi paternleri mozaik oluşur. Dizileri (örneğin, (G + T) açısından zengin, pürin açısından zengin, vb üsleri belirli bir taban veya kombinasyonu ile zenginleştirilmiştir uzunluğu 3-10 nükleotidler - Bu desen olarak adlandırılan Orta sınıf İnhomojenlik (MRG) bölgelerinde .) MR bölgeler genellikle gen ekspresyonu, rekombinasyon ve diğer genetik süreçler (2010 Fedorova & Fedorov) yönetmelikte yer alışılmadık (non-B formu) DNA yapılarıyla ilişkilidir. Sırasına homojen ek azaltmak için bu genom dizilerinin işlevsellik ve önemi (Prakash ve ark 2009) destekler eğilimindedir mutasyonlar karşı MRI bölgeler içinde güçlü bir fiksasyon önyargı varlığı.

Burada özgürce kullanılabilir internet kaynak göstermek - Genomik MR program paketi (. Bechtel ve ark 2008), içinde çeşitli MRG desenleri bulmak ve karakterize etmek amacıyla genom dizilerinin hesaplama analizi için tasarlanmış . Bu paket, aynı zamanda doğal giriş DNA dizilimleri için çeşitli özellikleri ve yazışma düzeyi ile randomize dizileri üretimi sağlar. Bu kaynak ana hedefi hala pek araştırılmalı ve kapsamlı arama ve tanıma bekliyor kodlamayan DNA büyük bölgelerin incelenmesi kolaylaştırmaktır.

Protocol

Perl kullanarak kağıt kullanılan tüm programlar yazılmıştır, ve tüm web sayfaları PHP kullanılarak oluşturulan edilmiştir.

1. Başlangıç ​​Noktası:

Http://mco321125.meduohio.edu/ ~ jbechtel / gmri / online Genomik MR paketinin ana sayfa açın. Web kaynakları da, "Yardım (How-to/README)" bağlantısını Genomik MR ve benzeri algoritmalar tüm malzemeleri "ilgili kaynaklara bağlantılar" bölümünde listelenen ise bağlantı, programları ile ilgili talimatlar / açıklamalar sağlar.

2. Hazırlık ve Giriş Sırası (ler) yükleniyor.

GMRI analiz oturumu başlatmak için FASTA biçimlendirilmiş dizisi (ler) ile bir dosya oluşturun. Bu dizinin kısa bir açıklama ile aynı hat üzerinde bir tanımlayıcı temsil eden ">" karakteri ile başlayan tek bir satır ile bu formatı her nükleotid dizisi öncesinde olmalıdır. GMRI analizi için DNA dizisi, R, Y, N, X, vb Hwever, non-A, T, C gibi karakterlere izin vermektedir, G karakterleri program tarafından işlenecek ve atlanır. Tekrarlayan elemanlarla ("K" lar yerine) "maskeli" hangi dizileri girdi olarak kullanılabilir. Dizisi karakterler büyük küçük harf duyarsız olduğunu unutmayın.

  1. Genomik MR ana sayfasında "Başlat veya Devam et" düğmesine tıklayarak bir GMRI oturumu başlayın. Bu nükleotid dizileri yüklenen bir sayfa için kullanıcı alır.
  2. FASTA biçimlendirilmiş dizileri Kopyala-yapıştır veya "dosya seçin" düğmesini kullanarak yerel bilgisayar dizileri içeren bir dosya yükleyin.
  3. "Bu dosya ile yeni bir oturum başlatın" düğmesine tıklayın. Bir onay mesajı girişi penceresinin üstündeki "dizisi başarıyla yüklendi" ve ayrıca bir alfanümerik "GMRI tanımlayıcı" sitesi bir "oturum etiketi" olarak adlandırdığı] oturumu için (örneğin b16yMj) almalısınız belirten görünmelidir İlk kullanımdan sonra iki hafta kadar bir oturum almak ve devam etmek için kullanılabilir.

NOT: Bundan sonra giriş dizileri "dosya" olarak adlandırılır.

3. Giriş Diziler (isteğe bağlı) Oligonükleotid Frekans Dağılımı alın.

"SRI Analyzer" sekmesine (üst satır) giriş dizilerinin tüm oligonükleotit frekansları bir dağıtım almak için tıklayın. İngilizce'deki SRI, kısa mesafeli homojen duruyor. Bu noktada, kullanıcı frekansları hesaplanmış olacak oligonükleotidler en yüksek uzunluğu (9 nükleotidler 2, varsayılan 6 NTS) belirtebilirsiniz. Bu seçim, "Maksimum oligomer boyutu" liste kutusunun içinde istediğiniz seçeneği tıklayarak yapılır . Sonra hesaplama başlatmak için "Dosya Analyze" butonuna basın. Kaba bir temsil giriş sırası kompozisyon hemen bu web sayfasının ortasında kısa bir tablo olarak görünür ve "userfile.comp.tbl" olarak indirilebilir. Bu tablo, sadece giriş dizileri içinde en çok ve en bol oligonükleotidler temsil eder.

"Download kompozisyon dosyası" linki ile elde edilebilir "userfile.comp" adlı bir dosya olarak, tüm olası oligonükleotidler tüm frekans tablosu oluşturulur .

NOT: SRI analizörü tüm örtüşen oligonükleotidler kümesinin tamamını sayar.

4. Rastgele Diziler Giriş Diziler (isteğe bağlı) olduğu gibi aynı Oligonükleotid kompozisyon oluşturun.

(Bu görev için gerekli protokolün 3. adımı tamamlanması).

  1. "SRI Jeneratör" sekmesinde (üst satır) rastgele dizileri oluşturan yeni bir web sayfası açmak için tıklayın. Rastgele dizileri bu web sayfasında liste kutusunu kullanarak elde edilecek örneklerin sayısını seçin. Bu örnek dosyaların her biri, "dosya" giriş dizileri olarak aynı sayıda ve uzunluğu rastgele dizileri içerecektir. Ayrıca, bir giriş sırası içeriyorsa, non-A, T, C veya G karakterleri, rastgele bir dizi giriş sırası gibi tam olarak aynı pozisyonlarda "K" lar var.
  2. Frekansları rastgele dizileri yaklaşık olacağı oligonükleotidler uzun süresini seçin. Bu ekranın merkezinde tabloda istenen oligomer düzeyi (örneğin dört-baz oligonükleotidler için "4-mers") için radyo düğmesini kontrol seçilebilir. Bu rastgele dizileri giriş dizileri olarak seçilen oligomer düzeyde yaklaşık frekansları, ama aynı zamanda kısa oligomer seviyelerine karşılık gelen frekansları değil, sadece oluşacak burada not edilmelidir. Oligonükleotid küçük dalgalanmalargiriş ve rastgele dizileri frekansları Markov Model rastgele dizilerinin üretimi için uygulanan prosedür nedeniyle mümkündür.
  3. "Dosya oluşturun" düğmesine tıklayarak programı başlatın. Giriş dizileri büyükse rasgele dizileri oluşturmak için bir kaç dakika sürebilir. Böylece, bu sayfanın en altındaki mavi "İndir" bağlantıları ortaya çıkıncaya kadar bir kullanıcı beklemeniz gerekir. Rastgele setleri gibi, "X rasgele set sayısı ve Y seçilen oligomer düzeyi (örneğin" userfile_rand2_4 ") userfile.randX_Y" gibi adlar ile dosya yerleştirilir .

5. Analizi (MRG), Giriş ve Rastgele Diziler Orta sınıf İnhomojenlik.

  1. Nükleotid dizilerinin kompozisyon orta menzilli homojen analiz eden yeni bir web sayfası açılır "MRI Analyzer" sekmesine (üst satır) üzerine tıklayın.
  2. Analiz etmek liste kutusu (giriş sırası ve rastgele dizileri oluşturulan setleri arasında bir tercih yapılabilir) "Dosya", analiz edilmesi için bir dizi seçin.
  3. MRG sağlanan liste kutusu üzerinden analiz edilmesi gereken içerik türünü seçin. (Yedi içerik seçenekler mevcuttur: G + C, G + A, G + T, A, G, C veya T.)
  4. "Pencere boyutu" liste kutusunda (geçerli aralık 30 - 1000 varsayılan 50 nükleotidler) ile, içerik ve zengin içerik-fakir dizileri ele alınacak olan pencerenin uzunluğu seçin .
  5. , Içerik ve zengin içerik-fakir bölgeler için üst eşik ve alt eşik, sırasıyla seçin . Bu eşikler penceresinde Geçerli pencereyi Özellikle nükleotidlerin tam sayısı (liste kutusunda numara seçeneği kullanarak) ya da bu nükleotidlerin yüzdesi ile tanımlanabilir (yüzde seçeneği kullanarak)
  6. Beş seçenek (örneğin: İçerik = GC; Pencere boyutu = 50; Üst eşik = 35; Sıra = "dosya" Alt eşik = 15) yapıldıktan sonra, Dosya düğmesine analiz basarak programı başlatın. Program, seçilen giriş tüm dizileri art arda tarar. Her adımda belirtilen pencere boyutu eşit uzunlukta mevcut sıra bir segment alır ve seçilen içerik nükleotidlerin sayısı ya da yüzde, üst eşiğin üstünde veya alt eşik değerinin altında olup olmadığını hesaplar. Pencere ya kriterlere uygun değilse, bir sonraki üst üste pencere (nükleotid biri tarafından kaydırılır) aynı analizi için seçilir. Dizisi içerik açısından zengin veya fakir kompozisyon için eşik gereksinimleri bir birleştiği yerde bir pencere bulunduğunda, programın çıktı dosyasının sırası bu pencere kaydeder ve grafik çıkışında bir başak oluşturur. Bundan sonra, program bir sonraki örtüşmeyen bitişik pencerede atlar ve Dizinin sonuna ulaşana kadar tarama süreci devam eder.
  7. Programın tamamlanmasından sonra, çıktı dosyasının bir bağlantı (isim "userfile_GC_50_35 .. 15" Yukarıdaki örnek için) görünür ve sonuçlarının grafiksel gösterimi (bkz. Şekil 1) web sayfasının ortasında görüntülenir. Aşağıda gösterildiği kilobases uzunluğu (kb), bu grafik ekran userfile tüm giriş dizileri tek bir dize halinde birleştirilmiş ve X ekseni üzerinde yatay bir siyah çizgi olarak sunulmuştur. Giriş dizileri boyunca tüm içerik bakımından zengin bölgeler mavi "yukarı" sivri ve kırmızı "aşağı" ani olarak içerik fakir bölgeler olarak işaretlenmiş. , Içerik ve zengin içerik-fakir pencereleri sayıların toplamı, bu rakamın altındaki efsanesi (sırasıyla 32 ve 19), parenthses gösterilmiştir. Bu rakam, göreceli bolluk ve MRI bölgelerin düzenleme göstermek için hizmet vermektedir. Bu arada, belirli ayrıntıları çıktı dosyası (bkz. Şekil 3) sunulmuştur. Bu dosyada, içerik bakımından zengin veya fakir kriterler ve koordinatları eşleşen tüm nükleotid dizisi bölümleri boyunca üst üste pozisyonlara girdi dosyası göre bir liste olarak bir kullanıcı için mevcuttur.
  8. MR tetkikinde seçilen dizisi tamamlandıktan sonra aynı web sayfasında bir kullanıcı parametreleri ve / veya girdi dosyaları değişiklikler yaparak yeni bir süreç başlayabilir. Örneğin, aynı MR parametreleri ile daha önce oluşturulan rastgele örnekleme # 1 incelemek için kullanıcı sadece seçeneği analiz etmek ve "userfile_rand1_4" dosyasını seçmek için Dosya değişiklik ihtiyacı var, ve sonra tekrar analiz Dosya düğmesine basın. Yeni bir dosya ve grafik ekran, eskisinin yerini alacak. TÜM sınavların sonuçları ve rakamlar her "oturumunda etikel" (GMRI tanımlayıcı) altında kaydedilir ve son etkinlik iki hafta kullanılabilir olacaktır. Sonuçları / incir kaydetmek içinures kalıcı olarak kullanıcı "Dosyaları" sekmesinde (üst satır) seçin ve bütün oturum ya da gerektiği gibi dosyaları tek tek indirmek gerekir .
  9. Bu MR Analyzer web sayfası ile bir kullanıcı çalışma
    • (G + C), zengin ve (A + T) zengin bölgeler
    • Pürin (A + G) zengin ve pirimidin (C + T) zengin bölgelerinden
    • Keto (G + T) ve amino zengin (A + C) zengin bölgelerinden
    • A ve A-fakir, zengin bölgelerde
    • G-zengin ve G-fakir bölgelerde
    • T-zengin ve T-fakir bölgelerde
    • C-zengin ve C-fakir bölgelerinden
  10. Genomik MR son sürümü Pürin (R) / Pirimidin zengin bölgelerinden çalışmak için yeni bir seçenek (Y) Z-DNA konformasyonlar oluşturabilecek arda desenler. Şu anda, bu seçenek "Z-DNA" linki mevcuttur ve diğer söz konusu MRG bölge olarak aynı temel üzerinde çalışır. Bir kullanıcı (RY + YR) sayısı için alt ve üst eşikleri seçmelisiniz tarama penceresinde üst üste dinükleotidleri. Program benzer bir grafik çıktı ve pürin ve pirimidin alternatif ile zenginleştirilmiş ve tüketilmiş DNA segmentlerinin bir dosya üretir. Varsayılan Z-DNA bölgeleri yüksek (inceleme F & F 2011), R / Y üsleri alternatif ile zenginleştirilmiş olmalıdır.

6. Genomik MR Paketi (isteğe bağlı) içinde Ek Programlar.

Genomik MR kaynak, aynı zamanda çok özel bir rastgele dizileri nesil için iki gelişmiş seçenekler vardır. Onlar, "MR Jeneratör" ve en üst satırındaki "CDS Jeneratör" sekme mevcuttur .

  1. MRG jeneratör girdi dosyası aynı oligonükleotid bileşimi (SRI jeneratör benzer) ile randomize dizileri oluşturur. Ancak, ek olarak, randomize dizileri, kullanıcı tarafından belirlenen belirli bir MR desen taklit eder. Bu web sayfası içinde bir kullanıcı bir liste kutusunda, belirli bir taklit eden bir MR desen belirtmelisiniz. Liste kutusunda Bu oturumda MRG analizörü (örn. "userfile_GC_50_35 .. 15") tarafından incelenmiş olan tüm desenleri içerir. Bu seçenek ile oluşturulan rasgele bir sıra seçilen giriş dosyası olarak aynı oligonükleotid kompozisyon ve "userfile_GC_50_35 .. 15" de görüldüğü gibi ve kötü desen de aynı GC-zengin olacaktır.
  2. CDS jeneratör protein kodlayan dizileri randomizasyon için kullanılır. Bu, kullanıcı tarafından belirlenen giriş kodlu biri olarak aynı amino asit dizilimine korur. Buna ek olarak, program, kullanıcı tarafından seçilen giriş tabloda belirtildiği gibi aynı kodon ve di-kodon önyargıları korur. CDS jeneratör online versiyonu, bir protein dizisi de girdi olarak kabul eder . Program için sadece ana Genomik MR web sayfasından indirmek için mevcut stand-alone Perl scriptleri ile diğer tüm seçenekler sunulmaktadır.

7. Temsilcisi Sonuçlar

Bu protokol, bir kullanıcı, kompozisyon nükleotid dizilerinin homojen dersleri veriyor. Daha da önemlisi, aynı zamanda giriş dizilerinin yaklaşık bir oligonükleotid bileşimi ile çeşitli randomize dizilerinin üretimi destekler. Genellikle karmaşık ökaryotlar genomik sekansları kompozisyon homojen değildir, daha ziyade, özellikle nükleotidler ile zenginleştirilmiş dizisi segmentleri karmaşık bir mozaik (örneğin, pürin açısından zengin (G + T)-zengin, (A + T) zengin temsil vb.) Bu orta sınıf ölçekli (3-10 bp) desen üst mavi kramponları ve düşük kırmızı sivri gibi içerik yoksul kesimlerin (bkz. Şekil 1 ve 2) gibi zengin içerikli segmentleri seçilen gösterir MRI analizörü grafik çıkışı görüntülendi. Tipik olarak, doğal bir sıra (Şekil 1) herhangi bir içerik açısından zengin ve içerik fakir bölgelerin sayısı aynı oligonükleotid ilgili randomize dizileri bölgeler aynı tip (Şekil 2) sayısından daha yüksek kez sipariş. bileşimi. Nükleotid kompozisyonu orta sınıf homojen olan bu dizi bölümleri kullanıcı için ilgi olabilir. Bunlar, daha fazla araştırma için Genomik MR çıktı dosyalarını mevcuttur .

Şekil 1
Şekil 1 adım 5.7 MRG analizörü grafik çıktı bir örnek. 44 insan intronların bir örnek üzerinde sonuçlar elde edilmiştir. Mavi çubuklar bu intronlar boyunca GC-zengin bölgelerde pozisyonları temsil eder. Kırmızı çubuklar GC-kötü (ya da AT-zengin) MRI bölgeleri temsil eder. Y-ekseni, belirli bir içerik türü için alt ve üst eşikleri içermektedir.

Şekil 2
Rasgele dizisi "userfile.rand1_4" Şekil 2. MR analizörü çıktı.
GraphiSRI jeneratör programı kullanarak rasgele oluşturulmuş bir dizisi içinde MRI cal temsili.

Şekil 3
Şekil 3. MR analizörü bir metin çıktı dosyasının başında bir örnek.
Programı tarafından tespit edilen tüm içerik ve zengin-fakir içerikli dizileri, en son (dördüncü) sütununda sunulmaktadır. Pencere sayısı olarak ölçülür Onların göreli konumları, ilk sütunda gösterilmiştir. Ikinci ve üçüncü sütunlarında sırasıyla, içerik ve zengin içerik-fakir bölgeler, göstergeleri.

Discussion

Orta menzilli ölçeklerde homojen nükleotid bileşimi (30-1000 nükleotidler) Bölgeler karmaşık ökaryotlarda genomlarındaki haddinden ve (intergenic bölgeler, intronlar, ekzonlarının çevrilmemiş bölgelerde, tekrarlayan elemanlar) her yerde bulunabilir. Bu bölgelerde sık sık değişik DNA konformasyonlar ilişkilidir. Örneğin, purine-/pyrimidine-rich dizileri DNA triplexes (Y-DNA) oluşturmak için eğilimindedir; pürin / pirimidin bazlar alternatif dizileri Z-DNA konformasyonlar ile ilişkilidir; (G + C) zengin bölgelerde yapısal anormallikler de sergileyebilirler B- (2010 Fedorov & Fedorova tarafından gözden) - DNA ve omurga bölünme eğilimli olabilir elemanı gevşemek DNA (A + T) zengin bölgelerde olağandışı bir yapı oluşturmak olabilir. Bu orta sınıf desen bazıları (örneğin, (G + T) zengin bölgeleri) pek araştırılmış ve hala kapsamlı arama ve tanıma bekliyor. Genomik MR web kaynağın temel amacı, kullanıcılara daha fazla deneysel analizi ve olası fonksiyonları araştırılması için MRG bu bölgelerin belirlenmesi yardımcı olmaktır . Bilgi MRI bölgelerin içine ve gen tahmini programlarının yeni nesil (Shepard 2010) genom fonksiyonları ve özellikleri anlayışımızı geliştirmek ve ilerletmek olabilir.

Disclosures

Çıkar çatışması ilan etti.

Acknowledgments

Samuel Shepard, Peter Bazeley, John David Bell ve Genomik MR web sayfalarının yönetimi için müteşekkiriz. Bu çalışma, Ulusal Bilim Vakfı Kariyer ödülü "intron hücresel rolleri İncelenmesi" tarafından desteklenen hibe MCB-0643542].

Materials

Name Company Catalog Number Comments
Computer with Internet
Files with nucleotide sequences for examination

DOWNLOAD MATERIALS LIST

References

  1. Bechtel, J. M., Wittenschlaeger, T., Dwyer, T., Song, J., Arunachalam, S., Ramakrishnan, S. K., Shepard, S., Fedorov, A. Genomic mid-range inhomogeneity correlates with an abundance of RNA secondary structures. BMC Genomics. 9, 284-284 (2008).
  2. Prakash, A., Shepard, S., Mileyeva-Biebesheimer, O., He, J., Hart, B., Chen, M., Amarachiniha, S., Bechtel, J., Fedorov, A. Molecular forces shaping human genomic sequence at mid-range scales. BMC Genomics. 10, 513-513 (2009).
  3. Fedorov, A., Fedorova, L. Chapter 3: An Intricate Mosaic of Genomic Patterns at Mid-range Scale. Advances in Genomic Sequence Analysis and Pattern Discovery. 65-91 (2010).
  4. Shepard, S. S. Chapter 4: Binary-abstracted Markov models and their application to sequence classificatio. The characterization and utilization of middle-range sequence patterns within human genome [dissertation]. The University of Toledo. 57-157 (2010).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics