October 8th, 2017
W przeciwieństwie do danych o sekwencjach DNA, dane epigenomiczne nie są łatwo poddawane wyszukiwaniom tekstowym. Poniżej przedstawiono procedury korzystania z ulepszonej wersji GeNemo, internetowego narzędzia bioinformatycznego, do przeprowadzania opartych na wzorcach poszukiwań podobieństw w danych epigenomicznych, porównując dostępne internetowe bazy danych, w tym Encyklopedię Elementów DNA, z danymi użytkownika.
Ogólnym celem tego filmu jest pokazanie naukowcom zajmującym się badaniami epigenetycznymi, jak korzystać z programu GeNemo do uzyskiwania regionów podobieństwa między różnymi znakami epigenetycznymi i różnymi typami komórek. Naszym celem przy tworzeniu tego programu było umożliwienie badaczom porównania funkcji komórek danych z ich rozległymi znanymi publicznymi bazami danych, takimi jak Encode i Mousington. Wyszukiwanie informacyjne z typowym wyszukiwaniem za pomocą słów kluczowych.
Na krawędzi twoich komórek znajdują się trzy primizacje K4 lub inne specyficzne krzywe. Chociaż te bałagany są przydatne, GeNemo może również szukać dodatków do rzeczywistych danych, a nie podobieństw w opisie danych. Załóżmy, że masz nowe białko zwalczające DNA, które nie ma żadnej lub ma niewielką wiedzę a priori na temat tego, do jakiego rodzaju modyfikacji epigenetycznych lub liczby komórek spodziewa się odnieść.
GeNemo może nadal pomóc w zawężeniu potencjalnych celów. GeNemo może odczytywać pliki w różnych formatach, w tym matematycznym i greckim, i będzie używać różnych metod dopasowywania wzorców, rozwiąże również odpychane regiony na podstawie ich wyniku podobieństwa i zapewni opcje eksportu danych. A teraz pokażemy, jak przeprowadzić wyszukiwanie GeNemo.
Aby korzystać z GeNemo, będziesz potrzebować własnego pliku danych i formatu BED lub big wig, który można przekonwertować z eksperymentalnych surowych danych za pomocą popularnych narzędzi bioinformatycznych, takich jak przeglądarka genomu UCSC. Najpierw przejdź do GeNemo.org. Na stronie głównej zobaczysz pole wyszukiwania z opcjami specyfikacji.
Wybierz gatunek, z którym chcesz porównać swoje dane. W tym samouczku użyjemy homosapiens jako gatunku referencyjnego. Następnie wybierz własny plik, który chcesz przesłać do GeNemo.
Ten plik może być hostowany online lub na dysku lokalnym. Skopiuj i wklej adres URL w tym polu, jeśli Twoje dane są online. Lub kliknij poniższy przycisk, aby przesłać lokalny plik danych.
W tym samouczku użyjemy przykładowego pliku. Czasami wyszukiwanie może zająć dużo czasu. Jeśli nie chcesz czekać, możesz podać swój adres e-mail w tym polu.
Po zakończeniu wyszukiwania otrzymasz wiadomość e-mail z linkiem do wyników. Jeśli podajesz własne dane w formacie BED, istnieje inny adres URL, pod którym możesz przesłać duży plik peruki tylko w celu wyświetlenia. W tym polu można również określić zakres wyszukiwania.
Aby określić zakres wyszukiwania, należy określić liczbę chromosomów, a także zakres par zasad. Następujące dwa dane wejściowe będą odczytywane tak samo. Chromosom 1:1-1000000. Lub zastępując znaki interpunkcyjne spacjami, co jest formatem pliku BED.
Chromosom 1 1 1000000. Teraz kliknij przycisk wyboru danych, aby wybrać typy ścieżek do wyszukania. Możesz kliknąć pola wyboru obok każdej próbki danych, aby ją przeszukać, ale dostępna jest również funkcja filtrowania.
Funkcja filtrowania jest pomocna przy wybieraniu wielu ścieżek w tym samym czasie. Tutaj możesz wybrać kategorię, z której chcesz filtrować, a także użyć przycisków u dołu zakładki. Pierwsze trzy przyciski są dość oczywiste.
Filtr powoduje, że wszystkie ścieżki, które nie należą do wybranych kategorii, stają się niezaznaczone. Coś w rodzaju bramy and. Z drugiej strony, wykluczenie powoduje, że wybrane kategorie stają się niezaznaczone.
Jak brama nie. Kiedy będziesz gotowy, kliknij przycisk wyszukiwania, aby rozpocząć wyszukiwanie. Jeśli przeszukujesz wiele ścieżek i/lub nie określiłeś mniejszego zakresu wyszukiwania, wyszukiwanie może chwilę potrwać.
W polu wyników zobaczysz różne sekcje genomu, w których plik danych i wyszukiwane gatunki są podobne w jednej lub więcej określonych sekwencjach śledzenia. Możesz kliknąć pobierz plik BED, aby pobrać plik zawierający listę pasujących regionów. Kliknij przycisk pokaż w każdym polu, aby wyświetlić pasującą sekcję.
W sekcji wyświetlania zobaczysz własną ścieżkę plików danych, a także pasującą ścieżkę lub ścieżki. Możesz poruszać się w górę lub w dół, przesuwając pasek na górze z etykietami par podstaw. Jak widać na tym przykładzie, góra tutaj jest podobieństwem między tymi dwoma torami.
Po obejrzeniu tego filmu powinieneś mieć dobre pojęcie o tym, jak uzyskać regiony podobieństwa między różnymi markerami epigenetycznymi za pomocą GeNemo. Wyniki wyszukiwania GeNemo będą obejmować markery epigenetyczne, znajdowanie czynników transkrypcyjnych, metylację DNA, dostępność chromogenu lub inne rodzaje sygnałów w różnych typach tkanek, które mają podobne wzorce w określonych lokalizacjach genomu do interesujących Cię danych. Stamtąd możesz być w stanie zauważyć, czy to białko wiążące DNA może wchodzić w interakcje z jakimś czynnikiem transkrypcyjnym, niektórymi elementami regulatorowymi, czy mieć coś wspólnego ze strukturą chromatyny i tak dalej.
Możesz również zauważyć, jakie typy tkanek mają największe podobieństwo do Twojego zestawu danych, który może zastosować funkcję rozwojową interesującego Cię białka. Przeprowadzając tak szerokie wyszukiwanie, GeNemo może zwrócić wstępne regiony, twórców i/lub typy komórek w stosunkowo krótkim czasie. Na podstawie tych wyników możliwe byłoby również zawężenie potencjalnych obszarów zainteresowania w celu przeprowadzenia przyszłych eksperymentów, takich jak wybór odpowiedniej linii komórkowej dla danego białka, testowanie interakcji z określonymi czynnikami transkrypcyjnymi lub modyfikacja epigenetyczna za pomocą Co IP, 30C, 4C, 5C lub HiC.
Mamy nadzieję, że ten samouczek był pomocny i stale pracujemy nad ulepszeniem GeNemo. W tym celu czekamy na wszelkie opinie.
Ten artykuł przedstawia samouczek dotyczący korzystania z GeNemo, internetowego narzędzia bioinformatycznego przeznaczonego do przeprowadzania wyszukiwań opartych na wzorcach w danych epigenomowych. Badacze mogą porównać swoje dane z rozległymi publicznymi bazami danych, aby zidentyfikować obszary podobieństwa między różnymi znakami epigenetycznymi i typami komórek.