September 5th, 2025
W tym artykule przedstawiono protokół korzystania z DeepSpaceDB, dynamicznej, interaktywnej bazy danych do transkryptomiki przestrzennej, oferującej przepływy pracy analizy i przykłady do badania organizacji tkanek i ekspresji genów związanych z chorobą.
Tworzymy bazę danych transkryptomiki przestrzennej o nazwie DeepSpaceDB. Zaproszenie ma na celu ułatwienie biologom i bioinformatykom dostępu do przestrzennych danych transkryptomicznych. Opracowano kilka platform transkryptomiki przestrzennej.
Pozwalają one naukowcom badać wzorce ekspresji genów w wycinkach tkanki. Ale ta technologia jest droga, a analiza danych wymaga wysokiego poziomu umiejętności bioinformatycznych. Korzystaliśmy z rytmu i platformy przestrzennej Xenium, Our Cancer CEX Research.
Ta platforma pozwala nam decydować o guzie, obrzęku, a nawet odległej tkance gospodarza w tym samym kontekście narządowym. Może nam pomóc w rozwiązaniu zmian w ekspresji i obliczeniach komórkowych w każdym przedziale z osobna. Jednym z głównych wyzwań stojących przed biologami jest przeprowadzenie analizy danych.
Jest więc wielu badaczy, którym brakuje niezbędnych umiejętności programistycznych i obliczeniowych, aby móc w pełni zinterpretować coraz większą liczbę przestrzennych zestawów danych transkryptomicznych, które stają się obecnie dostępne. Dzięki ułatwieniu dostępu do przestrzennych zbiorów danych transkryptomicznych baza danych umożliwia użytkownikom generowanie nowych hipotez i badanie mechanizmów leżących u podstaw różnych chorób. Tak więc, na przykład, możemy ocenić przestrzenne wzorce ekspresji genów związane z mikrośrodowiskiem guza.
Aby rozpocząć, kliknij zakładkę bazy danych i wybierz organizm jako mysz, narząd jako mózg, a źródło jako Zenodo. Przewiń wynikowe próbki i wybierz przykład oznaczony etykietą DSID001557. Następnie kliknij na wybraną próbkę i potwierdź, że opis odczytuje 2 miliony komórek w 100 mikrolitrach soli fizjologicznej NK.
Kliknij zakładkę jakości, aby ocenić jakość próbki. Z menu rozwijanego miar jakości wybierz opcje, takie jak wykryte geny, liczba odczytów i mito, aby wyświetlić odpowiednie rozkłady parametrów w wycinku próbki. Teraz przejdź do karty adnotacji obrazu, aby zidentyfikować różne regiony w przykładowym wycinku.
Przesuń kursor myszy na przykładowy plasterek, aby wyświetlić adnotacje. Wyświetlanie adnotacji opartych na siatce generowanych przez duży model językowy, które pokazują cechy anatomiczne i skojarzone warunki. Następnie przejdź do karty klastry, aby sprawdzić klastry typu komórki w przykładowym wycinku.
Wyświetlanie dwuwymiarowego osadzania klastrów i odpowiadającej im reprezentacji oznaczonej kolorami w miejscach na wycinku próbki. Następnie przejdź do zakładki geny, aby zbadać zmienne przestrzennie geny w próbce. Kliknij niektóre z najważniejszych genów na liście, aby wygenerować przestrzenne wykresy ich ekspresji w całym wycinku tkanki.
Obserwuj wzorce ekspresji oznaczone kolorami, które wyraźnie pokazują wyraźne rozkłady przestrzenne dla genów o najwyższej punktacji. Następnie przejdź do zakładki ścieżek, aby zbadać aktywność zestawów genów związanych z powszechnymi szlakami biologicznymi. Wyświetl listę przestrzennie zmiennych szlaków z aktywnością szlaku oszacowaną na podstawie poziomów ekspresji powiązanych genów.
Kliknij niektóre z górnych ścieżek na liście, aby wygenerować przestrzenne wykresy ich aktywności w całym wycinku tkanki. Obserwuj oznaczone kolorami wzorce aktywności szlaku w różnych regionach tkanki. Teraz przejdź do zakładki eksplorator tkanek, która pozwala użytkownikom dowolnie wybierać interesujące ich regiony i porównywać między nimi wzorce ekspresji genów.
Upewnij się, że wybór ręczny jest aktywny. Za pomocą kursora myszy zaznacz miejsca w okolicy hipokampa po lewej stronie wycinka mózgu myszy. Kliknij zestaw pierwszy, a następnie dodaj do zestawu, aby podświetlić wybrane miejsca na prawym panelu.
Następnie kliknij zestaw drugi i użyj kursora myszy, aby wybrać miejsca w obszarze podwzgórza wycinka mózgu. Kliknij dodaj do zestawu, aby podświetlić te wybrane miejsca po prawej stronie. Po zakończeniu wyboru miejsca kliknij przycisk porównania ekspresji genów.
Spowoduje to wygenerowanie tabeli wyświetlającej średnie wartości ekspresji genów dla każdego wybranego regionu wraz z reprezentacją wykresu punktowego. Przesuń kursor na poszczególne punkty na wykresie punktowym, aby potwierdzić nazwy genów i średnie wartości ekspresji w obu regionach. Na podstawie wyników porównania zidentyfikuj geny o zróżnicowanej ekspresji.
Wróć do zakładki geny i zwizualizuj ekspresję tych genów w całym wycinku tkanki. Kliknij zakładkę bazy danych i użyj filtra, aby wybrać organizm jako mysz, narząd jako wątrobę i stan jako rak. Z wynikowej listy próbek wybierz przykładową DSID001005.
Kliknij na wybraną próbkę i potwierdź, że z opisu wynika, że próbka pochodzi z wątroby myszy, zawierającej przerzuty pochodzenia raka jelita grubego. Następnie przejdź do zakładki eksplorator tkanek i aktywuj tryb wyboru ręcznego. Za pomocą kursora myszy wybierz miejsca odpowiadające regionowi nowotworu zidentyfikowanemu przez dodatnią ekspresję markera EpCAM w próbce DSID001005.
Kliknij zestaw jeden. Następnie wybierz dodaj do zestawu, aby podświetlić wybrane miejsca guza po prawej stronie. Teraz kliknij zestaw drugi i użyj kursora, aby wybrać miejsca w odległym obszarze nienowotworowym próbki wątroby.
Kliknij dodaj do zestawu, aby podświetlić wybrane miejsca nienowotworowe po prawej stronie wyświetlacza. Aby przeprowadzić dalszą analizę danych dotyczących ekspresji genów, kliknij opcję pobierania pliku CSV, generując plik z wartościami oddzielonymi przecinkami z danymi ekspresji genów dla dwóch regionów próbki. Po powtórzeniu kroków nawigacji po bazie danych dla DSID001007 upewnij się, że w opisie jest napisane, że jest to kolejny wycinek z wątroby myszy zawierający przerzuty pochodzenia raka jelita grubego.
Następnie upewnij się, że zostały wygenerowane dwa pliki CSV, po jednym z próbek DSID001005 i DSID001007, zawierające dwie kolumny reprezentujące średnią ekspresję genów w regionach nowotworowych i nienowotworowych. Załaduj oba pliki CSV do środowiska programistycznego języka R. Scalanie zestawów danych w celu przeprowadzenia dalszej analizy przy użyciu dwóch powtórzeń na warunek.
W języku R użyj pakietu limma, aby przeprowadzić różnicową analizę ekspresji genów w zestawie danych scalania. Przypisz regiony przerzutów do jelita grubego z obu próbek do grupy raka, a odległe zdrowe regiony do grupy kontrolnej. Przefiltruj wyniki, aby zidentyfikować geny o podwyższonej regulacji ze zmianą logarytmu większą niż 0,5 i skorygowaną wartością P mniejszą niż 0,05.
Podobnie ekstrahuj geny o zmniejszonej regulacji ze zmianą logarytmu mniejszą niż minus 0,5 i skorygowaną wartością P mniejszą niż 0,05. Po lewej stronie próbki mózgu myszy zaobserwowano wyraźny region niskiej jakości, charakteryzujący się zmniejszoną liczbą wykrytych genów i niższą liczbą odczytów. Próbka wykazała średnio około 4 000 wykrytych genów na plamkę, co dobrze zgadza się z rozkładem innych próbek w bazie danych.
W próbce mózgu myszy zidentyfikowano 15 klastrów przestrzennych z wyraźnymi granicami reprezentującymi różnice anatomiczne. Geny NRGN, SLC17A7 i DDN wykazywały silną ekspresję w regionie hipokampa. W przeciwieństwie do tego, ekspresja LY6H była zlokalizowana w obszarach korowych, szczególnie na dolnej lewej i prawej zewnętrznej krawędzi wycinka.
Aktywność sygnalizacyjna neuropeptydów była znacznie zwiększona w dolnych obszarach kory mózgowej wycinka próbki. Regulacja plastyczności synaptycznej została aktywowana w całym regionie hipokampa, szczególnie w górnych środkowych strefach. Aktywność transportu neuroprzekaźników była podwyższona w środkowej i prawej górnej części hipokampa.
Gen CLDN7, CLDN4 i ACTG1 wykazywał wyraźną regulację w górę w regionie guza z przerzutami do jelita grubego w próbce wątroby 001005. W przeciwieństwie do tego, ekspresja CLDN7, CLDN4 i ACTG1 była znacznie niższa w odległej zdrowej tkance wątroby próbki DSID001007.
Ten artykuł opisuje DeepSpaceDB, interaktywną bazę danych zaprojektowaną w celu poprawy dostępności danych transkryptomiki przestrzennej. Zapewnia ona przepływy pracy analitycznych dla badaczy, aby badać organizację tkanek i ekspresję genów związaną z różnymi chorobami.