$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Tutaj oferujemy metodę niezawodnego wykrywania zeza w wysokiej rozdzielczości czasowej za pomocą DeepLabCut. Zoptymalizowaliśmy parametry treningu i zapewniamy ocenę mocnych i słabych stron tej metody (Rysunek 1).
Po przeszkoleniu naszych modeli, sprawdziliśmy, że są one w stanie poprawnie oszacować górne i dolne punkty powieki (Rysunek 2), które służą jako punkty współrzędnych dla euklidesowej miary odległości. Odległość euklidesowa jest definiowana jako średnia długość odległości między dwoma górnymi i dolnymi punktami oka. Nasz model był w stanie wykryć przypadki zeza bez zeza (Rysunek 2A) i zez (Rysunek 2B). Niebieskie kropki wskazują punkty używane do określania odległości euklidesowej dla każdej klatki. Zielone, żółte, pomarańczowe i fioletowe kropki zostały użyte, aby pomóc modelowi w prawidłowym oszacowaniu odległości euklidesowej i zmniejszeniu wartości prawdopodobieństwa, gdy głowa znajduje się w nieoptymalnej pozycji (tj. biorąc pod uwagę ruchy głowy i zmiany pozycji w trakcie sesji). Następnie sprawdziliśmy dokładność modelu przy użyciu wielu różnych metod.
Aby sprawdzić idealną liczbę ramek używanych w modelu, wytrenowaliśmy i przetestowaliśmy cztery modele o różnych rozmiarach ramek próbki (Rysunek 3). Najpierw porównaliśmy wartości błędu średniokwadratowego (RMSE) między danymi testowymi i treningowymi, aby sprawdzić, jak dobrze modele mogą dokładnie przewidywać dane testowe, na których nie zostały wytrenowane. To porównanie pokazało, że zmienność między punktami oznaczonymi ręcznie a punktami oznaczonymi modelem wyrównała się po 300 klatkach. Trend ten korelował ze średnimi raportowanymi prawdopodobieństwami, które również wydawały się stabilizować po 300 oznaczonych klatekach. Użyliśmy tych zgłoszonych wartości prawdopodobieństwa, aby odfiltrować punkty, które były mniejsze niż 0,92. Te wartości prawdopodobieństwa wskazują, jak pewny jest model, że dany punkt został poprawnie oznaczony na podstawie danych treningowych. Uśredniliśmy te wartości dla punktów, które składają się na metrykę odległości euklidesowej, aby zbadać, jak dobrze modele działały względem siebie. Chociaż nie było znaczącej różnicy między 300 a 400 klatkami, użyliśmy 400 klatek, ponieważ średnia wartość prawdopodobieństwa przekraczała 0,95, co zbliża się do naszego progu ręcznego filtrowania i jest zgodna z progiem stosowanym w podobnych modelach do szacowania pozycji16.
Innym sposobem, w jaki sprawdziliśmy dokładność modelu, było porównanie ręcznie opisanych ramek z ramkami oznaczonymi DLC. Dwie niewidome osoby ręcznie opisały 300 klatek tego samego oka w ośmiu filmach. Wykorzystaliśmy te dane do skonstruowania macierzy pomyłek do oceny wyników prawdziwie i fałszywie dodatnich i ujemnych (Rysunek 4), w której ręcznie ocenione dane zostały użyte jako prawda podstawowa. W przypadku DLC dodatnia wartość zeza została zarejestrowana, gdy odległość euklidesowa została zarejestrowana jako mniejsza niż 75 pikseli (tj. zwierzę mruży oczy), a wartość ujemna została zarejestrowana dla wartości większych niż 75 pikseli (tj. zwierzę nie mruży oczu). Znaleźliśmy dodatnią wartość predykcyjną wynoszącą 96,96%, czyli procent czasu, w którym model dokładnie przewiduje zez w stosunku do ręcznie opisanego zeza. Znaleźliśmy ujemną wartość predykcyjną wynoszącą 99,66%, czyli procent czasu, w którym model dokładnie przewiduje brak zeza w stosunku do ręcznie opisanego zeza. Pokazują one proporcję wartości ujemnych i dodatnich, które zostały poprawnie oznaczone. Znaleźliśmy również wskaźnik prawdziwie dodatni wynoszący 98,1% i wskaźnik prawdziwie ujemny wynoszący 99,46%, które reprezentują dokładne przewidywanie wartości dodatnich i ujemnych w stosunku do wszystkich wartości dodatnich i ujemnych odpowiednio. Nasz współczynnik korelacji Matthewsa, czyli MCC, wynosił 93,8%, co wskazuje na współczynnik korelacji między wartościami obserwowanymi i przewidywanymi.
Gdy byliśmy pewni, że nasz model niezawodnie śledzi zeza, porównaliśmy tę metodę DLC z poprzednio opublikowaną metodą śledzenia zeza przy użyciu przedklinicznego zestawu danych dotyczących migreny14. Tę drugą metodę będziemy nazywać "modelem zeza obszarowego (ASM)", ponieważ została ona opracowana przy użyciu otwartego obszaru oka jako ciągłej zmiennej mierzącej zeza14. Model zeza obszaru wykorzystuje wyszkolone oprogramowanie do wykrywania twarzy w połączeniu z niestandardowym skryptem MATLAB do analizy średniego obszaru pikseli oka, wykluczając klatki ze wskaźnikiem błędów śledzenia >15%14. Jednym z głównych ograniczeń jest to, że "ASM" nie jest open source, a zatem nie jest powszechnie dostępny. DLC pozwala na zwiększoną optymalizację i adaptację bez konieczności znacznego zakupu oprogramowania i sprzętu.
Użyliśmy zestawu danych 10 samic i 10 samców myszy CD1. Eksperymentalnie wszystkie zwierzęta były aklimatyzowane w delikatnych ograniczeniach przez 30 minut przez łącznie 3 dni przed rozpoczęciem nagrań. Każde zwierzę było rejestrowane przez 5 minut w stosunku do wartości wyjściowej, a następnie 5 minut w przypadku zapisów leczenia. Podczas sesji terapeutycznych zwierzętom podawano dootrzewnowo PBS (nośnik) lub 0,1 mg/kg CGRP (leczenie) w celu wywołania stanu podobnego do migreny. Dane zostały zebrane w dobrze oświetlonym pomieszczeniu za pomocą kamer wyposażonych w światło podczerwone do oświetlania twarzy, zapewniając dokładne wykrywanie punktów orientacyjnych. W skład kamery termowizyjnej wchodził obiektyw Kowa LM35JC 2/3" 35 mm F1.6 z manualną przysłoną C-mount o ogniskowej 254 mm i odpowiednio wyregulowanej przysłonie. Po zebraniu danych wykorzystaliśmy ASM i DLC do analizy danych. Ponieważ ręczna ocena była tradycyjnie wykorzystywana w terenie do ilościowego określania grymasu twarzy, przy czym zez był jednym ze składników grymasu twarzy14, porównaliśmy również nasze dane z danymi ocenianymi ręcznie.
Na podstawie wcześniejszych ustaleń, że obwodowe wstrzyknięcie CGRP wywołuje reakcję zeza u myszy, spodziewaliśmy się zaobserwować znaczące różnice w reakcji na zeza między nośnikiem a leczeniem CGRP6,14. Porównaliśmy metody ASM, ręczne i DLC i stwierdziliśmy, że nasz model solidnie wykrył fenotyp zeza, podobnie jak metody ręczne i ASM (Rysunek 5). Należy zauważyć, że model ASM został wykorzystany do oceny bólu i zeza wywołanego CGRP. W tym badaniu Rea i wsp. porównali reakcję zeza po CGRP z reakcją zeza po wstrzyknięciu formaliny do tylnej łapy jako "bardziej tradycyjny" test indukcji bólu14. Co więcej, CGRP jest dobrze udokumentowane jako indukujące nadwrażliwość na dotyk u myszy za pomocą von Frey3,17. Zgodnie z terenem, znormalizowaliśmy średni zez podczas sesji terapeutycznej do 5-minutowej wartości wyjściowej przed leczeniem dla każdego zwierzęcia i porównaliśmy zwierzęta PBS (n = 10) z CGRP (n = 11). Analizy statystyczne grup PBS w porównaniu z grupami leczonymi CGRP są następujące. Odkryliśmy, że zwierzęta poddane działaniu CGRP wykazywały zmniejszoną średnią powierzchnię pikseli przy użyciu metody śledzenia obszaru zeza (p = 0,012, Rysunek 5A) i wykazywały zmniejszoną odległość euklidesową po ręcznej ocenie (p = 0,0007, Rysunek 5B) i przy użyciu naszego modelu DLC (p = 0,007, Rysunek 5C). Kiedy porównaliśmy każdą metodę w czasie u jednego reprezentatywnego zwierzęcia, zaobserwowano ten sam wzorzec (Rysunek 5). Zwierzę to wykazywało bardzo wyraźny fenotyp zeza w odpowiedzi na leczenie CGRP, ale nie na PBS. Wszystkie modele były w stanie wykryć te różnice, ale dane były najwyraźniej reprezentowane w naszym modelu DLC (Rysunek 5). Precyzyjne i dokładne wskaźniki są szczególnie ważne, gdy dane muszą być analizowane w dokładniejszych rozdzielczościach, w których uśrednianie nie wskazuje na pełny odczyt behawioralny (np. aktywność mózgu). Metoda DLC wykrywania zeza u myszy pozwala nam zbierać dane w milisekundowej skali czasowej i blokować je czasowo do pomiarów aktywności mózgu (np. lokalnych potencjałów pola), co zachodzi w milisekundowej skali czasowej. Następnie możemy wykorzystać tę technikę do zbudowania bardziej solidnego profilu stanu mózgu wskazującego na spontaniczny ból w kontekście migreny i innych złożonych zaburzeń mózgu.

Rysunek 1: Przegląd procedury generowania wyszkolonej sieci z DLC. Ogólny schemat procesu, w którym cechy oczu zwierzęcia są śledzone, a następnie analizowane za pomocą uczenia maszynowego. Skrót: DLC = DeepLabCut. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 2: Przykład automatycznego śledzenia mrużenia oczu w reprezentatywnej myszy CD1. (A) Przykład ramki przedstawiającej śledzenie DLC zeza (kolorowe kropki) na konturze oka w dniu leczenia, gdy mysz nie mruży oczu. (B) Przykład klatki przedstawiającej automatyczne wykrywanie zeza w dniu zabiegu, przy użyciu naszego modelu DLC. Odległość euklidesowa została zmierzona za pomocą średniej odległości między B i C, niebieskimi kropkami, na górze i na dole oka. Niebieskie zestawy kropek na górze i na dole oka są używane podczas śledzenia odległości euklidesowej. Pozostałe punkty (zielony, żółty, pomarańczowy, fioletowy) to punkty orientacyjne ramowe, które pomagają modelowi oszacować euklidesowe punkty odległości i odfiltrować nieoptymalne ułożenie głowy po zebraniu danych. Skrót: DLC = DeepLabCut. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 3: Uzasadnienie liczby klatek używanych do trenowania modelu. (A) Analiza błędu średniokwadratowego wskazuje średnią odległość między wartościami przewidywanymi a obserwowanymi dla zbiorów danych testowych i kolejowych. Zestaw danych treningowych reprezentuje ramki próbkowane podczas trenowania modelu, a zestaw danych testowych reprezentuje ramki niezwiązane z trenowaniem używane do sprawdzania, jak dobrze model może identyfikować podobne, ale różne obrazy. Użyliśmy pięciu zestawów danych treningowych i testowych i stwierdziliśmy, że wartości RMSE wyrównały się około 300 klatek dla grupy testowej. (B) Prawdopodobieństwo, że dany punkt jest poprawnie oznaczony (średnia + SEM). Okazało się, że 400 ręcznie oznaczonych ramek było idealnych, ponieważ surowe zestawy danych miały średnio ponad 0,95 prawdopodobieństwa, a jednocześnie miały wynik RMSE najbliższy wynikowi danych treningowych. Oznaczało to, że model był w stanie dokładnie przybliżyć punkty, na których został wytrenowany, a jednocześnie raportować większość klatek z dużym prawdopodobieństwem. Skrót: RMSE = błąd średniokwadratowy. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 4: Macierz pomyłek dla pomiarów zeza DLC. Pobraliśmy próbki 300 s z ośmiu filmów (pięć CGRP i trzy PBS) i porównaliśmy te punkty z ręcznie oznaczonym binarnym wynikiem tak lub nie dla zeza. Określiliśmy ilościowo przewidywane wartości jako te zidentyfikowane przez DLC, a rzeczywiste wartości jako te ocenione ręcznie przez człowieka. Następnie porównaliśmy to z ręcznie ocenianymi danymi, aby zobaczyć, jak często zez był prawidłowo identyfikowany w stosunku do ręcznie ocenianego binarnego tak lub nie zeza. Skróty: DLC = DeepLabCut; CGRP = peptyd związany z genem kalcytoniny; PBS = sól fizjologiczna buforowana fosforanami; TP = wyniki prawdziwie dodatnie; FP = wyniki fałszywie dodatnie; FN = wyniki fałszywie ujemne; TN = wartości prawdziwie ujemne; PPV = dodatnia wartość predykcyjna; NPV = ujemna wartość predykcyjna; TPR = wskaźnik prawdziwie dodatni; TNR = wskaźnik prawdziwie ujemny; MCC = współczynnik korelacji Mateusza. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.

Rysunek 5: Fenotyp zeza w trzech różnych modelach wykrywania zeza. Dwa górne rzędy zawierają to samo reprezentatywne zwierzę z każdym warunkiem (PBS lub CGRP) w trzech różnych modelach wykrywania zeza. Dolny wiersz odzwierciedla średnie dla wszystkich zwierząt. (A) Nastąpił spadek średniej powierzchni pikseli (średnia ogólna powierzchnia piksela / linia wyjściowa) u myszy traktowanych CGRP w porównaniu z myszami traktowanymi PBS (t(18) = 2,805, p = 0,012) po przetworzeniu wszystkich danych przy użyciu wcześniej opublikowanego i zwalidowanego modelu zeza obszarowego14. (B) Podobna odpowiedź wystąpiła w danych ocenianych ręcznie (t(18) = 4,064, p = 0,0007). (C) Myszy leczone CGRP wykazywały zmniejszoną średnią odległość od powieki do powieki (odległość euklidesowa / odległość euklidesowa przed leczeniem, wartość wyjściowa) niż myszy leczone PBS (t (18) = 3,040, p = 0,007 przy użyciu DLC do przetwarzania wszystkich danych. N = 20 (10 samic, 10 mężczyzn). Słupki błędów wskazują średnią ± SEM. Kliknij tutaj, aby zobaczyć większą wersję tego rysunku.