Method Article

Wyszukiwanie danych epigenomicznych w oparciu o wzorce za pomocą GeNemo

DOI:

10.3791/56136

October 8th, 2017

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W przeciwieństwie do danych o sekwencjach DNA, dane epigenomiczne nie są łatwo poddawane wyszukiwaniom tekstowym. Poniżej przedstawiono procedury korzystania z ulepszonej wersji GeNemo, internetowego narzędzia bioinformatycznego, do przeprowadzania opartych na wzorcach poszukiwań podobieństw w danych epigenomicznych, porównując dostępne internetowe bazy danych, w tym Encyklopedię Elementów DNA, z danymi użytkownika.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W porównaniu z solidnymi narzędziami do wyszukiwania danych genomicznych lub sekwencjonowania RNA, obecne metodologie wyszukiwania danych epigenomicznych i innych funkcjonalnych danych genomowych na podstawie wzorców są bardzo ograniczone. GeNemo to pierwsza wyszukiwarka internetowa, która osiąga ten cel. Użytkownicy wprowadzają swoje funkcjonalne dane genomiczne w formatach Browser Extensible Data (BED), Peaks i bigWig i mogą wyszukiwać dane w dowolnym z trzech formatów. Użytkownicy mogą określić, które typy zbiorów danych mają być przeszukiwane, wybierając spośród różnych zestawów danych online, przy czym Encyklopedia Elementów DNA (ENCODE) reprezentuje różne znaczniki epigenomiczne, miejsca wiązania czynników transkrypcyjnych oraz nadwrażliwość lub dostępność chromatyny w określonych typach komórek oraz etapach rozwoju lub gatunkach (myszy lub ludzi). GeNemo zwraca listę regionów genomu z wzorcami pasującymi do danych wejściowych, które można wyświetlić w przeglądarce, a także pobrać w formacie pliku BED. Zmodernizowany GeNemo ma ulepszony wyświetlacz graficzny, bardziej niezawodny interfejs i nie jest już podatny na błędy z powodu zmian w przeglądarce genomu Uniwersytetu Kalifornijskiego w Santa Cruz (UCSC). Omówiono kroki rozwiązywania typowych problemów. Ponieważ ilość funkcjonalnych danych genomicznych rośnie wykładniczo, istnieje pilna potrzeba opracowania i udoskonalenia nowych narzędzi bioinformatycznych, takich jak GeNemo, do analizy i interpretacji danych.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ostatnie osiągnięcia technologiczne pozwoliły na szybką ekspansję epigenomicznych lub funkcjonalnych depozytów danych genomowych, które wyprzedziły rozwój odpowiednich narzędzi analitycznych do wydobywania biologicznych spostrzeżeń. Jednym z ważnych sposobów analizy danych epigenomicznych jest przeszukiwanie danych generowanych przez użytkowników w depozytariuszach danych, a zwłaszcza tych z projektów Encyklopedii Elementów DNA (ENCODE)1 w celu dopasowania wzorców, które mogą prowadzić do nowej wiedzy. Na przykład zidentyfikowanie podobieństw we wzorcach dwóch różnych znaczników epigenomicznych w zdefiniowanych loci w całym genomie może wskazywać na skoordynowane działanie różnych graczy molekularnych na konformację chromatyny i regulację transkrypcji2,3,4.

Konwencjonalne wyszukiwarki tekstowe są nieskuteczne pod tym względem, ponieważ, w przeciwieństwie do sekwencji DNA, dane epigenomiczne istnieją głównie w formacie intensywności lub funkcjonalnych regionów genomu. GeNemo, skrót od Gene Nemo (jak od Finding Nemo), został opracowany, aby zaspokoić tę niezaspokojoną potrzebę za pomocą wyszukiwania opartego na wzorcach5. Jego algorytm wykorzystuje proces maksymalizacji Monte Carlo łańcucha Markowa5. Użytkownicy pobierają własne dane lub zestaw danych pobrany z depozytariuszy i przeszukują szereg danych epigenomicznych online, aby zidentyfikować podobieństwa we wzorcach.

Obecna wersja GeNemo ma zaktualizowany wyświetlacz, solidniej współpracuje z przeglądarką genomu Uniwersytetu Kalifornijskiego w Santa Cruz (UCSC)6, i jest mniej podatna na problemy spowodowane zmianami w tej ostatniej. W szczególności, podczas gdy strona wyników GeNemo była kiedyś oparta na interfejsie przeglądarki genomu UCSC, obecna wersja GeNemo obsługuje własną stronę wyników i w związku z tym zmiany strukturalne w przeglądarce genomu UCSC nie mają już negatywnego wpływu. GeNemo może wykorzystać dowolny sygnał genomowy, w tym wiązanie białek, modyfikację histonów, dostępność chromatyny, domeny topologiczne i tak dalej, jako zapytanie w celu znalezienia kolokalizowanych/podobnych segmentów wśród znanych zestawów danych z dużych konsorcjów. Dlatego jest to ważne narzędzie do badania związku między różnymi danymi epigenomicznymi będącymi przedmiotem zainteresowania a znanymi danymi generowanymi w ramach projektów genomicznych na dużą skalę.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

UWAGA: Protokół może być wstrzymany w dowolnym miejscu.

1. Podstawowa konfiguracja

  1. Uzyskaj plik w formacie BED, Peaks lub BigWig7 zawierający dane, które mają być wprowadzone do genomu. Plik powinien mieć rozszerzenie o nazwie odpowiednio "bed", "broadpeaks", "narrowpeaks" lub "bigWig".
    UWAGA: Spakowane wersje tego typu plików również będą działać.
  2. Użyj przeglądarki internetowej, aby przejść do genemo.org. Każdy system operacyjny zdolny do uruchamiania najpopularniejszych przeglądarek internetowych powinien być w stanie korzystać z GeNemo.
    1. Wybierz gatunek, według którego chcesz szukać, korzystając z menu rozwijanego. Obecnie dostępne gatunki to człowiek i mysz.
    2. Prześlij plik użytkownika za pomocą adresu URL lub przesłania bezpośredniego. Pliki BigWig działają tylko z metodą przesyłania adresów URL. Pliki w formacie BED i Peaks działają z obiema metodami (na razie nie można przesyłać plików Wiggle jako danych głównych).

2. Opcjonalna konfiguracja

  1. Podaj adres e-mail w odpowiednim polu, aby po zakończeniu wyszukiwania otrzymać wyniki wyszukiwania pocztą e-mail.
    UWAGA: Podczas przeszukiwania dużej części genomu i/lub dużej liczby ścieżek (patrz poniżej) zaleca się, aby użytkownik podał swój adres e-mail, ponieważ wyszukiwanie może zająć dużo czasu. Na przykład przeszukanie 100 megabase zajmuje około 15 s. Link do wyników wyszukiwania zostanie wysłany na podany adres e-mail po zakończeniu wyszukiwania. Link wygaśnie po 7 dniach od zakończenia wyszukiwania.
  2. Podaj plik bigwig lub plik wyświetlany wiggle może pochodzić z adresu URL. Ten plik wyświetlania nie będzie miał wpływu na wyniki; Będzie on wyświetlany tylko razem z wynikami.
  3. Określ zakres wyszukiwania (w tym pozycje chromosomów i par zasad) w odpowiednim polu.
    1. Wymień chromosom, początkową parę zasad i końcową parę zasad.
    2. Użyj "chrN" dla formatu chromosomu, gdzie "N" jest numerem/literą chromosomu (1, 2, ... X lub Y). W przypadku par podstawowych wystarczy wpisać liczby.
    3. Uwzględnij spacje między wszystkimi trzema wpisami lub uwzględnij dwukropek (:) między numerem chromosomu a pierwszą parą zasad i/lub łącznik między dwiema parami zasad. Na przykład: chr1:1000000-2000000, chr1 1000000 2000000, chr1 1000000-2000000, chr1:1000000 2000000.
      UWAGA: Kroki 2.1 - 2.3 są opcjonalne.

figure-protocol-1
Rysunek 1: Strona główna GeNemo z wypełnionymi niezbędnymi polami.Użytkownik musi wprowadzić gatunek, plik wyszukiwania i zakres wyszukiwania oraz wybrać ścieżki, według których chce przeszukać. Adres e-mail i plik wyświetlania są opcjonalne. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

3. Wybór danych

figure-protocol-2
Rysunek 2: Okno wyboru ścieżki.Zostanie to wywołane po kliknięciu przycisku "WYBÓR DANYCH" na stronie głównej. Tutaj użytkownicy wybierają ścieżki, według których chcą przeszukać plik wejściowy. Niektóre ścieżki są już domyślnie zaznaczone. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

  1. Po kliknięciu przycisku wyboru danych wybierz, jakie typy ścieżek chcesz przeszukiwać (tj. dodać do zapytania). Kolekcja ścieżek zawiera wiele różnych zestawów danych z laboratoriów na całym świecie.
    1. Ponieważ lista utworów jest dość długa, użytkownicy mogą chcieć użyć przycisku filtrowania (na górze), aby ułatwić wybór utworów. Ścieżki mogą być filtrowane według eksperymentu, tkanki, linii komórkowej i/lub laboratorium.
    2. Na dole znajduje się pięć przycisków, które ułatwiają wybór ścieżek: Zaznacz wszystko, Wybierz brak, Dodaj, Filtruj, Wyklucz.
    3. Zaznacz wszystko" i "Nie zaznaczaj żadnego" nie wymagają wyjaśnień.
    4. Przycisk "Dodaj" dodaje aktualnie wybrane utwory do zapytania. Służy jako bramka logiczna "OR". Należy pamiętać, że wybranie powyższych filtrów (np. niektóre eksperymenty, tkanki, linie komórkowe lub laboratoria) nie powoduje automatycznego dodania odpowiednich ścieżek do zapytania. Użytkownicy muszą najpierw wybrać ścieżki (np. mózg, wątroba pod tkanką), a następnie kliknąć przycisk "Dodaj", aby dodać je do zapytania. Podczas wybierania ścieżek należy pamiętać, że do zapytania wyszukiwania zostaną zastosowane tylko filtry określone w otwartej zakładce w oknie filtru. Wybory na innych kartach zostaną zapisane w oknie filtru, ale nie zostaną zastosowane do zapytania wyszukiwania.
    5. Przycisk "Filtruj" zachowuje tylko te typy ścieżek, które są aktualnie wybrane w oknie filtru w zapytaniu i usuwa wszystkie inne typy ścieżek. Służy jako bramka logiczna "AND". Zasadniczo "Filtr" pozwala na wybór interakcji między dwiema kategoriami ścieżek (np. niektóre tkanki z określonymi laboratoriami). Należy pamiętać, że opcja "Filtr" nie dodaje wybranych typów ścieżek do zapytania, jeśli nie ma ich jeszcze w zapytaniu.
    6. Przycisk "Wyklucz" usuwa z zapytania wszystkie typy ścieżek, które są aktualnie wybrane w oknie filtra. Służy jako bramka logiczna "NOT", w przeciwieństwie do funkcji "Filter". Również w tym przypadku opcja "Wyklucz" nie dodaje do zapytania żadnych ścieżek, które nie są aktualnie wybrane w oknie filtru.

figure-protocol-3
Rysunek 3: Okno filtru. Zostanie to wywołane po kliknięciu przycisku "FILTRUJ" w oknie wyboru ścieżki. Tutaj użytkownicy mogą wybrać wiele ścieżek w tym samym czasie, ze względną łatwością. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

figure-protocol-4
Rysunek 4: Jak korzystać z funkcji filtrowania. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

  1. Po dodaniu żądanych ścieżek do zapytania kliknij przycisk "Aktualizuj" w prawym dolnym rogu. Jest to konieczne, aby uwzględnić dwa sposoby wybierania danych: wybieranie poszczególnych ścieżek danych lub filtrowanie/wykluczanie. Przycisk "Resetuj widok" resetuje zapytanie do domyślnych ścieżek związanych z regulacją ekspresji genów w ludzkich/mysich embrionalnych komórkach macierzystych.
    UWAGA: Wybieranie ścieżek do przeszukiwania za pomocą opcji "Wybór danych" jest opcjonalne, ale zalecane, ponieważ domyślne ścieżki wyszukiwania najprawdopodobniej nie są dostosowane do potrzeb użytkownika.

4. Wyszukiwanie i wyniki

  1. Kliknij przycisk "Szukaj" po wybraniu danych. Wyszukiwanie może zająć trochę czasu.
  2. Po zakończeniu wyszukiwania użytkownicy zobaczą różne pola na stronie Wyniki. Każde pole reprezentuje sekcję genomu, w której plik danych użytkownika ma ściśle dopasowany wzorzec z co najmniej jedną ze ścieżek, o które użytkownik wysłał zapytanie.
    1. Jeśli nie ma widocznych pól, spróbuj przeszukać więcej typów ścieżek lub zwiększyć zakres wyszukiwania za pomocą tego samego pliku wejściowego. Łatwym sposobem na zrobienie tego bez przerabiania wszystkiego jest kliknięcie przycisku "☰" obok logo. Spowoduje to otwarcie paska bocznego, który pozwoli użytkownikowi zmodyfikować wyszukiwanie.
    2. Wyniki można wyeksportować jako plik BED, klikając przycisk "POBIERZ PLIK BED" na dole strony Wyniki.
  3. Kliknij przycisk Wizualizuj w prawym górnym rogu każdego pola, aby zwizualizować wyniki.
    1. W panelu Wizualizacja po prawej stronie wyświetlanych jest wiele elementów, w tym dane, które zawierają plik wejściowy użytkownika, plik wyświetlany, jeśli został wprowadzony, pasujące ścieżki i niektóre ścieżki domyślne. Na podstawie wyników użytkownik może porównać znane zestawy danych ENCODE z dostarczonym zestawem danych w celu dalszego zbadania. Użytkownik może również odwołać się do genów UCSC, aby zobaczyć kontekst wyników zapytania. Jeśli wybrane zostaną ścieżki z wielu linii/tkanek komórkowych, użytkownik może wykorzystać takie wyniki do uzyskania wglądu w specyficzność tkankową podobieństw między danym zestawem danych a zestawami danych ENCODE.
    2. Na stronie Wyniki użytkownik może przeciągać dowolne ścieżki, aby poruszać się w górę lub w dół genomu; gdy kursor myszy znajduje się na współrzędnych, użytkownik może użyć kółka myszy i/lub powiększać i pomniejszać.

figure-protocol-5
Rysunek 5: Strona z wynikami. To konkretne wyszukiwanie zwróciło 363 pasujące regiony. Wyświetlenie pierwszego pasującego regionu można wykonać, klikając przycisk "POKAŻ" w lewym dolnym rogu każdego wynikowego pola regionu. W lewej części okna wyświetlacza można zobaczyć, że dwa pliki danych (wejściowy i wybrana ścieżka) są podobne pod względem wzorca siły sygnału. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Pokazane tutaj w Rysunek 5 to symulowane wyszukiwanie. Wybrano gatunek ludzki, a odpowiadający mu plik próbki użyto jako pliku danych wejściowych. Ponadto wybrano domyślne ścieżki, jak widać w Rysunek 3. W sumie były 363 pasujące regiony, a pierwszy region jest wyświetlany na stronie wyświetlania. Można zauważyć, że wzorzec intensywności od podstawy 17036000 do 17038000 na chromosomie 1 dla pliku wejściowego i jednej z wybranych ścieżek jest bardzo podobny.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dogłębne zrozumienie epigenomu jest konieczne, aby osiągnąć pełny potencjał sekwencjonowania ludzkiego genomu w dostarczaniu nowych informacji biologicznych8. Obecnie istnieją tylko sposoby przeszukiwania internetowych zbiorów danych epigenomicznych według ich opisu danych i tytułu (tj. metadanych)1. To poważnie ogranicza rodzaje poszukiwań, które można przeprowadzić z danymi epigenomicznymi. Oparte na wzorcach narzędzia wyszukiwania danych epigenomicznych są niezbędne do badania relacji między różnymi znacznikami epigenomicznymi, co może prowadzić do nowych spostrzeżeń biologicznych. GeNemo, który wyszukuje według zawartości danych, a nie metadanych, jest pierwszą tego rodzaju usługą porównującą wzorce w danych epigenomicznych z opublikowanych depozytariuszy, takich jak baza danych ENCODE, z wygenerowanym przez użytkownika lub pobranym zbiorem danych5. Oznacza to początek dostępności narzędzia do wyszukiwania epigenomicznego, które jest szeroko dostępne dla naukowców na całym świecie, podobnie jak narzędzie do wyszukiwania sekwencji oparte na tekście stało się powszechnie dostępne w latach 90. Obecnie nie ma alternatywy dla opartych na wzorcach narzędzi wyszukiwania danych epigenomicznych online innych niż GeNemo.

Jednym z potencjalnych przykładów wykorzystania GeNemo jest wyszukiwanie współpojawiających się modyfikacji histonów i innych znaczników epigenetycznych z czynnikiem transkrypcyjnym E2F6 w ludzkich embrionalnych komórkach macierzystych (przykładowy plik sygnału wiązania E2F6 jest dostępny na portalu danych ENCODE lub pod adresem https://sysbio.ucsd.edu/public/xcao3/ENCODESample/ENCFF001UBC.bed). Używając tego pliku jako zapytania do wyszukiwania wszystkich zestawów danych ENCODE w H1-hESC, GeNemo pokaże, że sygnał wiązania E2F6 jest silnie wzbogacony o H3K4me1, H3K4me2, H3K4me3 i H3K27me3, co zgadza się z istniejącymi badaniami pokazującymi, że E2F6 reguluje niektóre geny poprzez metylację H3K279. Z drugiej strony wydaje się, że istnieje kolokalizacja miejsc wiązania E2F6 i CtBP2, o których wiadomo, że wchodzą w interakcje z czynnikiem z tej samej rodziny, E2F710. Te wyniki dla całego genomu w odniesieniu do dużej liczby znaczników epigenetycznych, sygnałów wiązania czynników transkrypcyjnych i innych sygnałów zawartych w ENCODE można dość łatwo uzyskać za pomocą GeNemo, który może dostarczyć wszystkich potencjalnych celów do dalszej analizy.

Od czasu pierwszej publikacji5 GeNemo jako internetowego narzędzia do wyszukiwania danych epigenomicznych, sekcja Wyniki GeNemo została zaktualizowana tak, aby wyglądała podobnie jak strona główna GeNemo. Stara sekcja wyników ściśle odzwierciedlała sekcję wyników przeglądarki genomu UCSC i była w dużej mierze zależna od zdalnego serwera UCSC do wyświetlania. Dzięki nowemu interfejsowi GeNemo jest bardziej przyjazny dla użytkownika i nie jest już zależny od serwera genomu UCSC (mimo że dane są nadal pobierane zdalnie). To sprawia, że GeNemo jest bardziej niezawodne i mniej podatne na problemy spowodowane zmianami w kodzie na serwerze UCSC. Co więcej, nowy, szybszy polimerowy interfejs GeNemo daje użytkownikowi więcej narzędzi do wizualizacji i analizy wzorców w danych.

Krytyczne kroki obejmują dostarczenie odpowiedniego pliku wejściowego i wybranie ścieżek danych do wyszukiwania. Zdecydowanie zachęca się użytkowników do eksperymentowania z różnymi funkcjami wyboru ścieżek, aby zapoznać się z procesem wyboru i tym, jak można łączyć różne polecenia, aby osiągnąć zamierzony wynik. W szczególności należy pamiętać, że funkcja "Dodaj" jest wymagana do dodania żądanych ścieżek wybranych do zapytania, podczas gdy "Filtruj" lub "Wyklucz" mogą być używane jako polecenia bramki logicznej odpowiednio "AND" i "OR". Funkcja "Aktualizuj" jest wymagana, aby wpłynąć na wszystkie wybory przed wdrożeniem wyszukiwania. Gdy nie zostaną zwrócone żadne wyniki, użytkownik może sprawdzić plik danych wejściowych, wyszukać więcej ścieżek lub zwiększyć zakres wyszukiwania. Za każdym razem, gdy wystąpi błąd, pojawi się okno definiujące, na czym dokładnie polega błąd. Jest jednak kilka niejednoznacznych błędów. Na przykład, gdy w oknie pojawia się komunikat "nie przesłano żadnego pliku", oznacza to, że albo żaden plik nie został przesłany, albo przesłany plik nie miał akceptowalnego formatu, a w konsekwencji program nie był w stanie poprawnie go odczytać. Dopuszczalne formaty plików do przesyłania plików to format BED i Peaks file dla obu metod przesyłania oraz bigWig tylko dla przesyłania linków online. Dopuszczalne są również spakowane wersje tych formatów plików.

Obecne ograniczenia tego podejścia obejmują jeszcze niezoptymalizowane algorytmy i funkcje stosowane w GeNemo. GeNemo nie może jeszcze udzielić żadnych wskazówek dotyczących interpretacji jakichkolwiek zwróconych zestawów danych. Zadanie to leży w gestii użytkowników, co wymaga znacznej wiedzy i doświadczenia w zakresie biologii genomu i epigenomu. Ponadto kolejnym obecnym ograniczeniem jest to, że użytkownicy nie mogą zmieniać czułości i poziomu szumów wyszukiwania. Oczekujemy, że w przyszłości będziemy nadal ulepszać i rozszerzać GeNemo w zakresie możliwości wyszukiwania wzorców i zbierania zestawów danych.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Autorzy nie mają żadnych konkurencyjnych interesów finansowych do ujawnienia.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ta praca była wspierana przez granty NIH, w tym DP1HD087990 z NICHD, R01HG008135 z NHGRI. Dziękujemy członkom laboratorium Zhong za cenne opinie.

Wkład autora:
X.C. i A.T.Z. zaktualizowali GeNemo, kodując nowy interfejs i funkcje; A.T.Z. wyprodukowało próbkę wideo we własnym zakresie; A.T.Z., X.C i S.Z. napisali artykuł.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
GENEMOhttps://www.genemo.orgPrzeglądarka Epigenomu Porównawczego

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. An integrated encyclopedia of DNA elements in the human genome. Nature. 489, 57-74 (2012).">The ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature. 489, 57-74 (2012).
  2. High-Resolution Profiling of Histone Methylations in the Human Genome. Cell. 129 (4), 823-837 (2007).">Barski, A., et al. High-Resolution Profiling of Histone Methylations in the Human Genome. Cell. 129 (4), 823-837 (2007).
  3. Epigenetic regulation of the neural transcriptome: the meaning of the marks. Nature Neuroscience. 13, 1313-1318 (2010).">Meaney, M. J., Ferguson-Smith, A. C. Epigenetic regulation of the neural transcriptome: the meaning of the marks. Nature Neuroscience. 13, 1313-1318 (2010).
  4. The genomic landscape of histone modifications in human T cells. PNAS. 103 (43), 15782-15787 (2006).">Roh, T. -Y., Cuddapah, S., Cui, K., Zhao, K. The genomic landscape of histone modifications in human T cells. PNAS. 103 (43), 15782-15787 (2006).
  5. GeNemo: a search engine for web-based functional genomic data. Nucleic Acids Res. 44, W122-W127 (2016).">Zhang, Y., Cao, X., Zhong, S. GeNemo: a search engine for web-based functional genomic data. Nucleic Acids Res. 44, W122-W127 (2016).
  6. The UCSC Genome Browser database: update 2011. Nucleic Acids Res. 39, 876-882 (2011).">Fujita, P. A., Rhead, B., Zweig, A. S., Hinrichs, A. S., Karolchik, D., Cline, M. S., Goldman, M., Barber, G. P., Clawson, H., Coelho, A., et al. The UCSC Genome Browser database: update 2011. Nucleic Acids Res. 39, 876-882 (2011).
  7. An expansive human regulatory lexicon encoded in transcription factor footprints. Nature. 489, 83-90 (2012).">Neph, S., Vierstra, J., Stergachis, A. B., Reynolds, A. P., Haugen, E., Vernot, B., Thurman, R. E., John, S., Sandstrom, R., Johnson, A. K., et al. An expansive human regulatory lexicon encoded in transcription factor footprints. Nature. 489, 83-90 (2012).
  8. Next-generation sequencing and epigenomics research: a hammer in search of nails. Genomics Inform. 12 (1), 2-11 (2014).">Sarda, S., Hannenhalli, S. Next-generation sequencing and epigenomics research: a hammer in search of nails. Genomics Inform. 12 (1), 2-11 (2014).
  9. Silencing of the Meiotic Genes SMC1β and STAG3 in Somatic Cells by E2F6. J Biol Chem. 280, 41380-41386 (2005).">Storre, J., et al. Silencing of the Meiotic Genes SMC1β and STAG3 in Somatic Cells by E2F6. J Biol Chem. 280, 41380-41386 (2005).
  10. Interaction of E2F7 Transcription Factor with E2F1 and C-terminal-binding Protein (CtBP) Provides a Mechanism for E2F7-dependent Transcription Repression. J Biol Chem. 288, 24581-24589 (2013).">Liu, B., Shats, I., Angus, S. P., Gatza, M. L., Nevins, J. R. Interaction of E2F7 Transcription Factor with E2F1 and C-terminal-binding Protein (CtBP) Provides a Mechanism for E2F7-dependent Transcription Repression. J Biol Chem. 288, 24581-24589 (2013).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

GeNemo SearchEpigenomic Data AnalysisPattern based SearchBED File FormatbigWig FormatENCODE DatasetsUCSC Genome BrowserFunctional GenomicsEpigenetic MarksTranscription Factor Binding

Related Articles