July 29th, 2022
DiCoExpress to narzędzie oparte na skryptach zaimplementowane w R do przeprowadzania analizy sekwencyjnej RNA, od kontroli jakości do koekspresji. DiCoExpress obsługuje kompletną i niezrównoważoną konstrukcję do 2 czynników biologicznych. Ten samouczek wideo prowadzi użytkownika przez różne funkcje DiCoExpress.
DiCoExpress zapewnia kompletną analizę aorystyczną od kontroli jakości do koekspresji. Przeprowadza analizę różnicową na podstawie kontrastów wewnątrz uogólnionego modelu liniowego. Co więcej, może również przeprowadzić analizę wzbogacenia listy genów o zróżnicowanej ekspresji i klastrów genów o współekspresji.
Główną zaletą DiCoExpress jest to, że mogą z niego korzystać osoby takie jak ja, bez szczególnej wiedzy ze statystyki czy programowania lotniczego. To naprawdę pomaga użytkownikowi niebędącemu specjalistą w napisaniu kontrastu niezbędnego do różnicowej analizy ekspresji genów. Zapewnia również graficzne wyniki ilustrujące wyniki gotowe do publikacji.
DiCoExpress nie jest narzędziem dedykowanym do planów. Może być stosowany w odniesieniu do każdego organizmu, o ile projekt eksperymentalny jest kompletny z maksymalnie dwoma czynnikami biologicznymi. Co więcej, możliwa jest również konstrukcja membrany z nierówną liczbą powtórzeń między warunkami.
Początkujący powinien mieć wstępną wiedzę w R. Powinieneś wiedzieć, jak korzystać z funkcji i identyfikować wymagane i opcjonalne argumenty. Następnie krytycznym krokiem jest poprawne dostarczenie plików zawierających i projekt eksperymentalny. Aby rozpocząć, otwórz sesję R studio.
Ustaw katalog na skrypty szablonów i otwórz skrypt DiCoExpress tutorial dot R. Załaduj funkcje DiCoExpress w sesji języka R. Następnie załaduj pliki danych w sesji języka R i podziel pliki danych obiektowych na kilka obiektów w celu łatwego manipulowania plikami.
Następnie wybierz strategię spośród warunków NB lub replikatów NB i progu filtrowania genów o niskiej ekspresji. Określ kolory grupy i wybierz metodę normalizacji. Następnie przeprowadź kontrolę jakości.
Jeśli dane są sparowane zgodnie z czynnikiem replikacji, stan replikuje się jako prawda, w przeciwnym razie stan jest fałszywy. Przypisz interakcję jako prawdziwą, aby rozważyć interakcję między dwoma czynnikami biologicznymi. W przeciwnym razie przypisz wartość false, a następnie określ model statystyczny i zdefiniuj próg współczynnika fałszywych odnajdywań.
Przeprowadzić analizę różnicową, a następnie ustalić próg dla analizy wzbogacenia i przeprowadzić analizę wzbogacenia list genów o zróżnicowanej ekspresji. Wybierz listy stopni szczegółowości do porównania. Podaj nazwę porównania listy i użyj tej samej nazwy dla katalogu, w którym zostaną zapisane pliki wyjściowe.
Ustaw operację parametru na union lub intercin, aby określić akcję, która ma zostać wykonana na listach DEG i porównaj listy. Przeprowadź analizę koekspresji, a następnie przeprowadź analizę wzbogacenia klastrów koekspresji. Na koniec wygeneruj dwa pliki dziennika zawierające wszystkie informacje niezbędne do odtworzenia analizy.
Całkowita znormalizowana liczba próbek powinna być podobna, gdy porównuje się zarówno warunki wewnętrzne, jak i pośrednie. Znormalizowana liczba ekspresji genów wykazywała podobną medianę i wariancję, zarówno w warunkach wewnętrznych, jak i pośrednich. W celu zidentyfikowania potencjalnych struktur danych bazowych wygenerowano wykresy PCA.
Zaobserwowano wyraźne rozróżnienie między terapiami i brak było grupowania, co wskazuje na dobrą jakość zestawu danych. Surowe histogramy pvalue zostały wykreślone w celu oceny jakości modelowania. Rozkład surowych wartości p-line był jednolity, z wartością szczytową po lewej stronie rozkładu, zgodnie z oczekiwaniami.
Brak piku po prawej stronie końcowej wskazuje, że modelowanie statystyczne wydaje się poprawne. Przedstawiono profil ekspresji genu CIG62301.1, w każdym genotypie i stanie. Oprócz liczby genów o zróżnicowanej ekspresji w górę i w dół, wykreślono również dla każdego badanego kontrastu.
Analizę koekspresji przeprowadzono na unii pięciu list DEG. Zidentyfikowany przez kontrast, szukając zmienności odpowiedzi na leczenie między genotypem pierwszym lub drugim w porównaniu z innymi. Geny o koekspresji dla każdego zidentyfikowanego klastra wydrukowano w indywidualnych plikach tekstowych i wykreślono profil ekspresji genów.
Dzięki DiCoExpress biolodzy uzyskają analizę ekspresji genów, która jest statystycznie poprawna. Następnym krokiem jest nadanie tym wynikom sensu biologicznego.
View the full transcript and gain access to thousands of scientific videos
DiCoExpress to narzędzie oparte na skrypcie zaimplementowane w R do analizy RNA-Seq, obejmujące kontrolę jakości do koekspresji. Jest przeznaczone dla użytkowników bez rozległej wiedzy statystycznej, czyniąc je przystępnym dla osób niebędących specjalistami.