RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
pl_PL
Menu
Menu
Menu
Menu
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
To jest metoda trenowania wielowarstwowego U-Net do wieloklasowej segmentacji tomogramów krioelektronowych przy użyciu części jednego tomogramu jako danych wejściowych do treningu. Opisujemy, jak wywnioskować tę sieć z innymi tomogramami i jak wyodrębnić segmentacje do dalszych analiz, takich jak uśrednianie subtomogramu i śledzenie włókien.
Tomografia krioelektronowa (cryo-ET) pozwala naukowcom obrazować komórki w ich naturalnym, uwodnionym stanie w najwyższej obecnie możliwej rozdzielczości. Technika ta ma jednak kilka ograniczeń, które sprawiają, że analiza generowanych przez nią danych jest czasochłonna i trudna. Ręczna segmentacja pojedynczego tomogramu może trwać od kilku godzin do kilku dni, ale mikroskop może z łatwością wygenerować 50 lub więcej tomogramów dziennie. Obecne programy segmentacji głębokiego uczenia dla cryo-ET istnieją, ale ograniczają się do segmentacji jednej struktury na raz. W tym przypadku wielowarstwowe konwolucyjne sieci neuronowe U-Net są trenowane i stosowane do automatycznej segmentacji wielu struktur jednocześnie w kriotomogramach. Przy odpowiednim przetwarzaniu wstępnym, sieci te mogą być solidnie wywnioskowane dla wielu tomogramów bez potrzeby trenowania poszczególnych sieci dla każdego tomogramu. Ten przepływ pracy znacznie poprawia szybkość, z jaką można analizować tomogramy krioelektronowe, skracając czas segmentacji do mniej niż 30 minut w większości przypadków. Co więcej, segmentacje mogą być wykorzystywane do poprawy dokładności śledzenia włókien w kontekście komórkowym oraz do szybkiego wyodrębniania współrzędnych do uśredniania subtomogramu.
Rozwój sprzętu i oprogramowania w ciągu ostatniej dekady doprowadził do "rewolucji rozdzielczości" dla mikroskopii krioelektronowej (cryo-EM)1,2. Dzięki lepszym i szybszym detektorom3, oprogramowaniu do automatyzacji zbierania danych4,5, oraz zaawansowanym funkcjom wzmacniania sygnału, takim jak płytki fazowe6, zbieranie dużych ilości danych kriogenicznych o wysokiej rozdzielczości jest stosunkowo proste.
Cryo-ET zapewnia bezprecedensowy wgląd w ultrastrukturę komórkową w natywnym, uwodnionym stanie7,8,9,10. Podstawowym ograniczeniem jest grubość próbki, ale wraz z przyjęciem metod takich jak mielenie skupionej wiązki jonów (FIB), gdzie grube próbki komórkowe i tkankowe są rozrzedzane do tomografii11, horyzont tego, co można obrazować za pomocą cryo-ET, stale się poszerza. Najnowsze mikroskopy są w stanie wyprodukować ponad 50 tomogramów dziennie, a przewiduje się, że tempo to wzrośnie tylko ze względu na rozwój schematów szybkiego gromadzenia danych12,13. Analiza ogromnych ilości danych wytwarzanych przez cryo-ET pozostaje wąskim gardłem dla tej metody obrazowania.
Ilościowa analiza informacji tomograficznych wymaga najpierw adnotacji. Tradycyjnie wymaga to segmentacji rąk przez eksperta, co jest czasochłonne; W zależności od złożoności molekularnej zawartej w kriotomogramie, może to zająć godziny lub dni poświęconej uwagi. Sztuczne sieci neuronowe są atrakcyjnym rozwiązaniem tego problemu, ponieważ można je wytrenować do wykonywania większości prac związanych z segmentacją w ułamku czasu. Konwolucyjne sieci neuronowe (CNN) są szczególnie przydatne do zadań związanych z widzeniem komputerowym14 i zostały ostatnio przystosowane do analizy tomogramów krioelektronowych15,16,17.
Tradycyjne CNN wymagają wielu tysięcy próbek treningowych z adnotacjami, co często nie jest możliwe w przypadku zadań analizy obrazów biologicznych. W związku z tym architektura U-Net doskonale radzi sobie w tej dziedzinie18, ponieważ opiera się na rozszerzaniu danych, aby skutecznie trenować sieć, minimalizując zależność od dużych zestawów treningowych. Na przykład, architektura U-Net może być trenowana za pomocą zaledwie kilku wycinków pojedynczego tomogramu (czterech lub pięciu plasterków) i solidnie wnioskowana na innych tomogramach bez ponownego trenowania. Ten protokół zawiera przewodnik krok po kroku dotyczący trenowania architektur sieci neuronowych U-Net w celu segmentacji kriotomogram elektronowych w Dragonfly 2022.119.
Dragonfly to komercyjnie opracowane oprogramowanie służące do segmentacji i analizy obrazów 3D za pomocą modeli głębokiego uczenia się, które jest swobodnie dostępne do użytku akademickiego (obowiązują pewne ograniczenia geograficzne). Posiada zaawansowany interfejs graficzny, który pozwala laikom w pełni wykorzystać możliwości głębokiego uczenia się zarówno do segmentacji semantycznej, jak i odszumiania obrazu. Protokół ten pokazuje, jak wstępnie przetwarzać i opisywać tomogramy krioelektronowe w Dragonfly w celu trenowania sztucznych sieci neuronowych, które można następnie wywnioskować w celu szybkiej segmentacji dużych zbiorów danych. W dalszej części omówiono i pokrótce pokazano, jak wykorzystać dane segmentowane do dalszej analizy, takiej jak śledzenie włókien i ekstrakcja współrzędnych w celu uśredniania subtomogramu.
UWAGA: Dragonfly 2022.1 wymaga stacji roboczej o wysokiej wydajności. Zalecenia systemowe znajdują się w Tabeli Materiałów wraz ze sprzętem stacji roboczej używanej dla tego protokołu. Wszystkie tomogramy używane w tym protokole są 4-krotnie binowane od rozmiaru piksela od 3,3 do 13,2 ang/pix. Próbki wykorzystane w reprezentatywnych wynikach zostały uzyskane od firmy (zob. tabela materiałów), która przestrzega wytycznych dotyczących opieki nad zwierzętami, które są zgodne ze standardami etycznymi tej instytucji. Tomogram używany w tym protokole i multi-ROI, który został wygenerowany jako dane wejściowe treningu, zostały dołączone jako zestaw danych w pakiecie do pliku uzupełniającego 1 (który można znaleźć pod adresem https://datadryad.org/stash/dataset/doi:10.5061/dryad.rxwdbrvct), dzięki czemu użytkownik może śledzić te same dane, jeśli chce. Dragonfly obsługuje również bazę danych o otwartym dostępie o nazwie Infinite Toolbox, w której użytkownicy mogą udostępniać wyszkolone sieci.
1. Konfiguracja
2. Import obrazów
3. Przetwarzanie wstępne (Rysunek 1.1)
4. Utwórz dane treningowe (Rysunek 1.2)
5. Korzystanie z kreatora segmentacji do szkolenia iteracyjnego (Rysunek 1.3)
6. Zastosuj sieć (Rysunek 1.4)
7. Manipulacja segmentacją i czyszczenie
8. Generowanie współrzędnych do uśredniania sub-tomogramu na podstawie ROI
9. Transformacja zlewni

Rysunek 1: Przepływ pracy. 1) Wstępnie przetworzyć tomogram treningowy, kalibrując skalę intensywności i filtrując zestaw danych. 2) Utwórz dane treningowe, ręcznie dzieląc niewielką część tomogramu na segmenty ze wszystkimi odpowiednimi etykietami, które użytkownik chce zidentyfikować. 3) Używając przefiltrowanego tomogramu jako danych wejściowych i segmentacji dłoni jako danych wyjściowych treningu, w kreatorze segmentacji trenowana jest pięciowarstwowa, wielowarstwowa sieć U-Net. 4) Wytrenowaną sieć można zastosować do pełnego tomogramu w celu opisania go, a renderowanie 3D można wygenerować z każdej segmentowanej klasy. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.
Zgodnie z protokołem, pięciowarstwowy U-Net został przeszkolony na jednym tomogramie (Rysunek 2A) w celu zidentyfikowania pięciu klas: Membrana, Mikrotubule, Aktyna, Markery Fiducial i Tło. Sieć została iteracyjnie przeszkolona w sumie trzy razy, a następnie zastosowana do tomogramu, aby w pełni go segmentować i opisywać (Rysunek 2B, C). Minimalne czyszczenie zostało wykonane przy użyciu kroków 7.1 i 7.2. Kolejne trzy interesujące nas tomogramy (Rysunek 2D,G,J) zostały załadowane do oprogramowania w celu wstępnego przetworzenia. Przed importem obrazu jeden z tomogramów (Ryc. 2J) wymagał regulacji rozmiaru piksela z 17,22 A/px do 13,3 A/px, ponieważ został zebrany pod innym mikroskopem w nieco innym powiększeniu. Program IMOD squeezevol został użyty do zmiany rozmiaru za pomocą następującego polecenia:
'squeezevol -f 0.772 plik_wejściowy.mrc plik_wyjściowy.mrc'
W tym poleceniu, -f odnosi się do czynnika, za pomocą którego należy zmienić rozmiar piksela (w tym przypadku: 13,3/17,22). Po zaimportowaniu wszystkie trzy cele wnioskowania zostały wstępnie przetworzone zgodnie z krokami 3.2 i 3.3, a następnie zastosowano pięciowarstwową sieć U-Net. Ponownie przeprowadzono minimalne czyszczenie. Końcowe segmentacje są wyświetlane w Rysunek 2.
Segmentacje mikrotubul z każdego tomogramu zostały wyeksportowane jako binarne (krok 7.4) pliki TIF, przekonwertowane na MRC (program IMOD tif2mrc), a następnie użyte do korelacji cylindrów i śledzenia filamentów. Binarne segmentacje włókien skutkują znacznie bardziej niezawodnym śledzeniem włókien niż śledzenie na tomogramach. Mapy współrzędnych ze śledzenia włókien (Rysunek 3) zostaną wykorzystane do dalszych analiz, takich jak pomiary najbliższego sąsiedztwa (upakowanie filamentu) i spiralne uśrednianie subtomogramu wzdłuż pojedynczych włókien w celu określenia orientacji mikrotubul.
Nieudane lub nieodpowiednio wyszkolone sieci są łatwe do określenia. Uszkodzona sieć nie będzie w stanie w ogóle segmentować żadnych struktur, podczas gdy nieodpowiednio przeszkolona sieć zazwyczaj będzie prawidłowo segmentować niektóre struktury i będzie miała znaczną liczbę wyników fałszywie dodatnich i fałszywie ujemnych. Sieci te można korygować i iteracyjnie trenować w celu poprawy ich wydajności. Kreator segmentacji automatycznie oblicza współczynnik podobieństwa kości modelu (nazywany wynikiem w SegWiz) po jego wytrenowaniu. Ta statystyka daje oszacowanie podobieństwa między danymi treningowymi a segmentacją U-Net. Dragonfly 2022.1 ma również wbudowane narzędzie do oceny wydajności modelu, do którego można uzyskać dostęp w zakładce Sztuczna inteligencja u góry interfejsu (zobacz dokumentację dotyczącą użytkowania).

Rysunek 2: Wnioskowanie. (A-C) Oryginalny tomogram treningowy neuronu szczura hipokampa DIV 5, zebrany w 2019 roku na Titan Krios. Jest to rekonstrukcja wstecznie rzutowana z korektą CTF w IMOD. (A) Żółte pole reprezentuje region, w którym przeprowadzono segmentację dłoni w celu uzyskania danych wejściowych do treningu. (B) Segmentacja 2D z sieci U-Net po zakończeniu szkolenia. (C) Renderowanie 3D segmentowanych obszarów pokazujących błonę (niebieski), mikrotubule (zielony) i aktynę (czerwony). (D-F) DIV 5 neuron szczura hipokampa z tej samej sesji co tomogram treningowy. (E) Segmentacja 2D z U-Net bez dodatkowego szkolenia i szybkiego czyszczenia. Błona (niebieska), mikrotubule (zielona), aktyna (czerwona), fiducials (różowa). (F) Renderowanie 3D podzielonych na segmenty regionów. (G-I) DIV 5 neuron szczura hipokampa z sesji z 2019 roku. (H) Segmentacja 2D z U-Net z szybkim czyszczeniem i (I) renderowanie 3D. (J-L) DIV 5 neuron szczura hipokampa, pobrany w 2021 roku na innym Titan Krios w innym powiększeniu. Rozmiar piksela został zmieniony za pomocą programu IMOD squeezevol, aby pasował do tomogramu treningowego. (K) Segmentacja 2D z U-Net z szybkim czyszczeniem, demonstrująca solidne wnioskowanie w zestawach danych z odpowiednim przetwarzaniem wstępnym i (L) renderowanie segmentacji 3D. Podziałka liniowa = 100 nm. Skróty: DIV = dni in vitro; CTF = funkcja transferu kontrastu. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 3: Poprawa śledzenia filamentu. (A) Tomogram neuronu hipokampa szczura DIV 4, zebrany na Titan Krios. (B) Mapa korelacji wygenerowana na podstawie korelacji cylindrów nad filamentami aktyny. (C) Śledzenie włókien aktyny z wykorzystaniem intensywności włókien aktynowych na mapie korelacji w celu zdefiniowania parametrów. Śledzenie wychwytuje błonę i mikrotubule, a także szum, próbując jednocześnie śledzić samą aktynę. (D) Segmentacja tomogramu metodą U-Net. Błona podświetlona na niebiesko, mikrotubule na czerwono, rybosomy na pomarańczowo, triC na fioletowo, a aktyna na zielono. (E) Segmentacja aktyny ekstrahowana jako maska binarna do śledzenia włókien. (F) Mapa korelacji wygenerowana z korelacji cylindra o tych samych parametrach z (B). (G) Znacznie ulepszone śledzenie samych filamentów aktynowych z tomogramu. Skrót: DIV = dni in vitro. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.
Plik uzupełniający 1: Tomogram używany w tym protokole oraz multi-ROI, który został wygenerowany jako dane wejściowe treningu, są dołączone jako zestaw danych (Training.ORSObject). Zobacz https://datadryad.org/stash/dataset/doi:10.5061/dryad.rxwdbrvct.
Licencja otwartego dostępu do tego protokołu została opłacona przez Object Research Systems.
To jest metoda trenowania wielowarstwowego U-Net do wieloklasowej segmentacji tomogramów krioelektronowych przy użyciu części jednego tomogramu jako danych wejściowych do treningu. Opisujemy, jak wywnioskować tę sieć z innymi tomogramami i jak wyodrębnić segmentacje do dalszych analiz, takich jak uśrednianie subtomogramu i śledzenie włókien.
To badanie było wspierane przez Penn State College of Medicine oraz Wydział Biochemii i Biologii Molekularnej, a także grant Tobacco Settlement Fund (TSF) 4100079742-EXT. Usługi i instrumenty CryoEM i CryoET Core (RRID:SCR_021178) wykorzystane w tym projekcie zostały częściowo sfinansowane przez Pennsylvania State University College of Medicine za pośrednictwem Biura Prodziekana ds. Badań i Doktorantów oraz Departamentu Zdrowia Pensylwanii przy użyciu funduszy na rzecz rozliczeń tytoniowych (CURE). Wyłączną odpowiedzialność za treść ponoszą autorzy i niekoniecznie reprezentują one oficjalne poglądy Uniwersytetu lub Kolegium Medycznego. Departament Zdrowia Pensylwanii wyraźnie zrzeka się odpowiedzialności za jakiekolwiek analizy, interpretacje lub wnioski.
| badań | obiektowych | Dragonfly 2022.1 | https://www.theobjects.com/dragonfly/index.html |
| E18 Szczur Zdysocjowana | tkanka transnetyx | hipokampa KTSDEDHP | https://tissue.transnetyx.com/faqs |
| IMOD | University of Colorado | https://bio3d.colorado.edu/imod/ | |
| Intel® Xeon® Złoty procesor 6124 3,2 GHz | Intel | ||
| https://www.intel.com/content/www/us/en/products/sku/120493/intel-xeon-gold-6134-processor-24-75m-cache-3-20-ghz/specifications.html NVIDIA Quadro P4000 | NVIDIA | https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/productspage/quadro/quadro-desktop/quadro-pascal-p4000-data-sheet-a4-nvidia-704358-r2-web.pdf | |
| Windows 10 Minimalne | wymagania dotyczące stacji roboczej Microsoft | https://www.microsoft.com/en-us/evalcenter/evaluate-windows-10-enterprise Enterprise 2016 | |
| https://theobjects.com/dragonfly/system-requirements.html |