December 1st, 2023
Tutaj prezentujemy protokół demonstrujący instalację i wykorzystanie potoku bioinformatycznego do analizy danych sekwencjonowania chimerycznego RNA używanych w badaniach in vivo interakcji RNA:RNA.
Protokół ten obejmuje instalację i praktyczne kroki korzystania z potoku obliczeniowego przeznaczonego do analizy danych sekwencjonowania o wysokiej przepustowości z chimerycznego niekodującego RNA, docelowych interakcji RNA. Strategia molekularna tworzenia chimerycznych RNA jest stosunkowo nowym osiągnięciem, które ma zalety w porównaniu z wcześniejszymi bioinformatycznymi narzędziami predykcyjnymi w jednoznacznym zrozumieniu krajobrazu interakcji niekodującego RNA w całym genomie. Dane sekwencjonowania wygenerowane w wyniku wysokoprzepustowego sekwencjonowania chimerycznych RNA mogą stanowić wyzwanie analityczne dla nowych użytkowników tej strategii.
Ustanowiliśmy wieloplatformowy potok obliczeniowy o otwartym kodzie źródłowym, który jest wysoce opatrzony adnotacjami, aby umożliwić użytkownikom na poziomie podstawowym analizowanie danych z eksperymentów z sekwencjonowaniem chimerycznego niekodującego RNA, docelowego RNA. W przyszłych eksperymentach Meffert-Lab planuje wykorzystać analizę obliczeniową za pomocą SCRAP na zestawach danych wygenerowanych w wyniku naszych trwających badań oraz do regulacji posttranskrypcyjnej w układzie nerwowym ssaków, a także utrzymać aktualizację SCRAP na naszym GitHubie. Przed rozpoczęciem instalacji SCRAP na platformie Mac OS X wykonaj polecenie, które git, w terminalu, aby potwierdzić istnienie Git.
Aby sprawdzić instalację Miniconda, wpisz which conda w terminalu. Aby zainstalować Miniconda, zapoznaj się z plikiem markdown platformy SETUP w repozytorium GitHub Meffert-Lab, aby uzyskać instrukcje dotyczące instalacji w systemach Windows, MacOS i Ubuntu. W przypadku systemów Mac, korzystając z Menedżera pakietów Home Brew, użyj polecenia, brew install miniconda, aby zainstalować Miniconda.
Aby zainstalować Conda, uruchom, conda init, określając używaną powłokę, a następnie zamknij i ponownie otwórz powłokę. Pomyślna instalacja powoduje wyświetlenie środowiska podstawowego aktywowanego w sesji terminalu. Następnie uruchom wskazany klon git, aby uzyskać najnowszą kopię kodu źródłowego SCRAP.
Zainstaluj Mambę, ulepszony program do rozwiązywania pakietów dla Conda. Za pomocą następującego polecenia zainstaluj wszystkie zależności dla SCRAP z SCRAP_environment. yml do własnego środowiska Conda.
Następnie należy użyć wskazanego skryptu bash specyficznego dla organizmu, którego oddziaływania sncRNA, mRNA są analizowane pod kątem SCRAP. Podaj katalog folderu źródłowego SCRAP i wykonaj kroki instalacji, używając plików w folderach fasta i adnotacji. Upewnij się, że ścieżka katalogu jest kompletna i kończy się ukośnikiem.
Zapoznaj się z tabelami w pliku readme. md w celu uzyskania prawidłowych skrótów gatunków opartych na Mir. Aby uzyskać zaktualizowany genom referencyjny, użyj przeglądarki genomu UCSC lub NCBI Genome Data Hub.
Sprawdź odpowiednie species.annotation. bed files w katalogu adnotacji w folderze źródłowym SCRAP. Jeśli zachodzi potrzeba przeanalizowania innego gatunku, należy dostarczyć wskazany plik.
Po zainstalowaniu zależności i SCRAP należy użyć wskazanego skryptu, aby zainicjować analizę SCRAP z określoną strukturą poleceń. Wyświetl pełną ścieżkę do przykładowych katalogów bez żadnego skrótu i sformatuj przykładowe katalogi z nazwą folderu zgodną z nazwą przykładu. Podkreśl, że podana ścieżka prowadzi do katalogu zawierającego wszystkie przykładowe foldery, a nie do pojedynczego przykładowego folderu lub pliku.
Następnie wyświetl całą ścieżkę do pliku adaptera. Sprawdź, czy przykładowe nazwy w pliku adaptera są zgodne z wcześniej wymienionymi nazwami folderów i nazwami plików. Określ typ próbki, sparowany koniec lub pojedynczy koniec, i określ wybór filtrów RNA dla pre miRNA, tRNA i opcjonalnie czyszczenia RNA.
Wymień całą ścieżkę do katalogu referencyjnego, skrót miRBazy i skrót genomu referencyjnego. Po uruchomieniu SCRAP użyj wskazanego polecenia skryptu, aby wykonać Peak_Calling. Wyświetla listę pełnych ścieżek do katalogu zawierającego przykładowe foldery i plik karty.
Następnie zdefiniuj kryteria Peak_Calling, w tym minimalną liczbę odczytów sekwencjonowania oraz liczbę odrębnych bibliotek sekwencjonowania potrzebnych do rozpoznania szczytu. Należy wskazać, czy do pików muszą przyczyniać się sncRNA z tej samej rodziny, co jest istotne dla miRNA, które mają wspólne sekwencje nasienne i mogą wiązać się z nakładającymi się celami genów. Następnie wskaż pełną ścieżkę do katalogu referencyjnego, skrót miRBase i skrót genomu referencyjnego.
Po Peak_Calling uruchom skrypt Peak_Annotation. Podaj pełną ścieżkę do wynikowych szczytów. łóżko od Peak_Calling do katalogu referencyjnego i żądanego gatunku do adnotacji.
Użyj scalania samtools, aby scalić wszystkie żądane pliki BAM, aby ułatwić połączoną wizualizację. Następnie użyj sortowania samtools do sortowania scalonych wierszy po wierszu. Plik BAM.
Indeksowanie posortowanego. Plik BAM przy użyciu indeksu Samtools, generując binarny plik indeksu w formacie Samtools, wymagany dla narzędzi do wizualizacji genomu. Na koniec w przeglądarce Integrative Genomics Viewer otwórz posortowane.
bam i indeksowane. według pliku. Zastosowanie zmodyfikowanej wersji SCRAP do wcześniej opublikowanych zestawów danych sekwencjonowania ujawniło spadek interakcji miRNA z regionami intronów.
Zmniejszenie zaobserwowano po wyizolowaniu interakcji o wysokim poziomie ufności za pomocą Peak_Calling za pomocą SCRAP.
View the full transcript and gain access to thousands of scientific videos
To badanie przedstawia protokół instalacji i praktycznego użycia otwartoźródłowego potoku bioinformatycznego zaprojektowanego do analizy sekwencjonowania chimerycznych RNA, ułatwiając lepsze zrozumienie interakcji RNA:RNA in vivo.