$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Qui, forniamo un metodo per il rilevamento affidabile dello strabismo ad alta risoluzione temporale utilizzando DeepLabCut. Abbiamo ottimizzato i parametri di allenamento e fornito una valutazione dei punti di forza e di debolezza di questo metodo (Figura 1).
Dopo aver addestrato i nostri modelli, abbiamo verificato che erano in grado di stimare correttamente i punti superiore e inferiore della palpebra (Figura 2), che fungono da punti di coordinate per la misura della distanza euclidea. La distanza euclidea è definita come la lunghezza media delle distanze tra i due punti superiore e inferiore dell'occhio. Il nostro modello è stato in grado di rilevare casi di strabismo (Figura 2A) e strabismo (Figura 2B). I punti blu indicano i punti utilizzati per determinare la distanza euclidea per ogni fotogramma. I punti verdi, gialli, arancioni e viola sono stati utilizzati per aiutare il modello a stimare correttamente la distanza euclidea e diminuire il valore di verosimiglianza quando la testa si trova in una posizione non ottimale (cioè, tenendo conto del movimento della testa e dei cambiamenti di posizione tra le sessioni). Abbiamo quindi convalidato l'accuratezza del modello utilizzando una serie di metodi diversi.
Per convalidare il numero ideale di fotogrammi utilizzati per il modello, abbiamo addestrato e testato quattro modelli di dimensioni variabili (Figura 3). Per prima cosa abbiamo confrontato i valori di errore quadratico medio (RMSE) tra i dati di test e quelli di addestramento per convalidare la capacità dei modelli di prevedere con precisione i dati di test su cui non erano stati addestrati. Questo confronto ha mostrato che la variabilità tra i punti etichettati manualmente e i punti etichettati dal modello si stabilizzava dopo 300 fotogrammi. Questa tendenza è correlata alle medie riportate per la probabilità che sembravano stabilizzarsi dopo 300 fotogrammi etichettati. Abbiamo utilizzato questi valori di verosimiglianza riportati per filtrare i punti inferiori a 0,92. Questi valori di verosimiglianza indicano il grado di certezza del modello che un determinato punto sia stato etichettato correttamente in base ai dati di addestramento. Abbiamo calcolato la media di questi valori per i punti che contribuiscono alla metrica della distanza euclidea per esaminare le prestazioni dei modelli l'uno rispetto all'altro. Sebbene non vi fosse alcuna differenza significativa tra 300 e 400 fotogrammi, abbiamo utilizzato 400 fotogrammi perché la media era superiore al valore di verosimiglianza di 0,95, che si avvicina alla nostra soglia per il filtraggio manuale e si allinea con la soglia utilizzata in modelli simili per la stima della posa16.
Un altro modo in cui abbiamo convalidato l'accuratezza del modello è stato con una matrice di confusione che confrontava i fotogrammi annotati manualmente con i fotogrammi etichettati con DLC. Due individui ciechi hanno annotato manualmente 300 fotogrammi dello stesso occhio in otto video. Abbiamo utilizzato questi dati per costruire una matrice di confusione per valutare veri e falsi positivi e negativi (Figura 4), in cui i dati valutati manualmente sono stati utilizzati come verità di base. Per i DLC, è stato registrato un valore positivo di strabismo quando la distanza euclidea è stata registrata come inferiore a 75 pixel (cioè l'animale strizza gli occhi) e un valore negativo è stato registrato per valori superiori a 75 pixel (cioè l'animale non strizza gli occhi). Abbiamo trovato un valore predittivo positivo del 96,96%, che è la percentuale di tempo in cui il modello prevede con precisione lo strabismo rispetto a uno strabismo annotato manualmente. Abbiamo trovato un valore predittivo negativo del 99,66%, che è la percentuale di tempo in cui il modello prevede con precisione l'assenza di strabismo rispetto allo strabismo annotato manualmente. Questi mostrano la proporzione di valori negativi e positivi che sono stati etichettati correttamente. Abbiamo anche trovato un tasso di veri positivi del 98,1% e un tasso di veri negativi del 99,46%, che rappresentano la previsione accurata del modello di valori positivi e negativi rispetto a tutti i valori positivi e negativi, rispettivamente. Il nostro coefficiente di correlazione di Matthews, o MCC, era del 93,8%, indicando il coefficiente di correlazione tra i valori osservati e previsti.
Una volta che siamo stati sicuri che il nostro modello tracciasse in modo affidabile lo strabismo, abbiamo confrontato questo metodo DLC con un metodo di monitoraggio dello strabismo precedentemente pubblicato utilizzando un set di dati preclinici sull'emicrania14. Ci riferiremo a quest'altro metodo come "modello di strabismo ad area (ASM)" perché è stato sviluppato utilizzando l'area dell'occhio aperto come variabile continua di misurazione dello strabismo14. Il modello di strabismo dell'area utilizza un software di rilevamento facciale addestrato combinato con uno script MATLAB personalizzato per analizzare l'area media dei pixel dell'occhio, escludendo i fotogrammi con un tasso di errore di tracciamento del >15%14. Una delle principali limitazioni è che l'"ASM" non è open source e, quindi, non è ampiamente accessibile. I DLC consentono una maggiore ottimizzazione e adattabilità senza richiedere un acquisto significativo di software e hardware.
Abbiamo utilizzato un set di dati di 10 topi CD1 femmine e 10 maschi. Sperimentalmente, tutti gli animali sono stati acclimatati in delicate restrizioni per 30 minuti per un totale di 3 giorni prima dell'inizio delle registrazioni. Ogni animale è stato registrato per 5 minuti di basale e poi 5 minuti per le registrazioni del trattamento. Durante le sessioni di trattamento, gli animali sono stati trattati con PBS (veicolo) o 0,1 mg/kg di CGRP (trattamento) per via intraperitoneale per indurre uno stato simile all'emicrania. I dati sono stati raccolti in una stanza ben illuminata utilizzando telecamere dotate di luce infrarossa per illuminare il viso, garantendo un rilevamento accurato dei punti di riferimento. La telecamera a infrarossi includeva un obiettivo Kowa LM35JC 2/3" 35 mm F1.6 con diaframma manuale C-Mount con una distanza focale di 254 mm e un'apertura opportunamente regolata. Dopo aver raccolto i dati, abbiamo utilizzato l'ASM e il DLC per analizzare i dati. Poiché il punteggio manuale è stato convenzionalmente utilizzato sul campo per quantificare la smorfia facciale, con lo strabismo che è una componente della smorfia facciale14, abbiamo anche confrontato i nostri dati con i dati valutati manualmente.
Sulla base di precedenti risultati secondo cui l'iniezione periferica di CGRP induce una risposta strabica nei topi, ci aspettavamo di osservare differenze significative nella risposta strabica tra il veicolo e il trattamento CGRP 6,14. Abbiamo confrontato i metodi ASM, manuali e DLC e abbiamo scoperto che il nostro modello ha rilevato in modo robusto un fenotipo strabico, così come i metodi manuali e ASM (Figura 5). È importante notare che il modello ASM è stato utilizzato per valutare il dolore e lo strabismo indotti da CGRP. In quello studio, Rea et al. hanno confrontato la risposta allo strabismo dopo CGRP con la risposta allo strabismo dopo l'iniezione di formalina della zampa posteriore come un test di induzione del dolore "più tradizionale"14. Inoltre, è ben documentato che il CGRP induce ipersensibilità al tatto nei topi attraverso l'uso di von Frey 3,17. Coerentemente con il campo, abbiamo normalizzato lo strabismo medio durante la sessione di trattamento a un basale pretrattamento di 5 minuti per ciascun animale e abbiamo confrontato PBS (n = 10) rispetto agli animali trattati con CGRP (n = 11). Le analisi statistiche dei gruppi trattati con PBS rispetto a CGRP sono le seguenti. Abbiamo scoperto che gli animali trattati con CGRP mostravano una diminuzione dell'area media dei pixel utilizzando il metodo di tracciamento dello strabismo dell'area (p = 0,012, Figura 5A) e mostravano una diminuzione della distanza euclidea quando valutavano manualmente (p = 0,0007, Figura 5B) e utilizzando il nostro modello DLC (p = 0,007, Figura 5C). Quando abbiamo confrontato ciascun metodo nel tempo in un singolo animale rappresentativo, è stato osservato lo stesso modello (Figura 5). Questo animale ha mostrato un fenotipo strabico molto chiaro in risposta al trattamento con CGRP ma non alla PBS. Tutti i modelli sono stati in grado di rilevare queste differenze, ma i dati sono stati rappresentati più chiaramente nel nostro modello DLC (Figura 5). Metriche precise e accurate sono particolarmente importanti quando i dati devono essere analizzati a risoluzioni più fini in cui la media non è indicativa della lettura comportamentale completa (ad esempio, l'attività cerebrale). Il metodo DLC per rilevare lo strabismo nei topi ci consente di raccogliere dati su una scala temporale di millisecondi e di bloccarli nel tempo su misure di attività cerebrale (ad esempio, potenziali di campo locali), che si verifica su una scala temporale di millisecondi. Possiamo quindi utilizzare questa tecnica per costruire un profilo più robusto di uno stato cerebrale indicativo di dolore spontaneo nel contesto dell'emicrania e di altri disturbi cerebrali complessi.

Figura 1: Panoramica della procedura per la generazione di una rete addestrata con DLC. Schema generale del processo mediante il quale le caratteristiche oculari di un animale vengono tracciate e quindi analizzate utilizzando l'apprendimento automatico. Abbreviazione: DLC = DeepLabCut. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 2: Esempio di tracciamento automatico dello strabismo in un mouse CD1 rappresentativo. (A) Esempio di un fotogramma che mostra lo strabismo di tracciamento DLC (punti colorati) sul contorno dell'occhio durante il giorno del trattamento quando il mouse non strizza gli occhi. (B) Esempio di un fotogramma che mostra il rilevamento automatico dello strabismo il giorno del trattamento, utilizzando il nostro modello DLC. La distanza euclidea è stata misurata utilizzando la distanza media tra B e C, i punti blu, sulla parte superiore e inferiore dell'occhio. Le serie di punti blu nella parte superiore e inferiore dell'occhio vengono utilizzate per tracciare la distanza euclidea. Gli altri punti (verde, giallo, arancione, viola) sono punti di riferimento di inquadratura utilizzati sia per aiutare il modello a stimare i punti di distanza euclidei sia per filtrare il posizionamento non ottimale della testa dopo la raccolta dei dati. Abbreviazione: DLC = DeepLabCut. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 3: Giustificazione del numero di frame utilizzati per addestrare il modello. (A) L'analisi dell'errore quadratico medio indica la distanza media tra i valori previsti e quelli osservati per i set di dati di prova e di treno. Il set di dati di training rappresenta i frame campionati durante il training del modello, mentre il set di dati di test rappresenta i frame non di training utilizzati per convalidare la capacità del modello di identificare immagini simili ma diverse. Abbiamo utilizzato cinque set di dati di addestramento e test e abbiamo scoperto che i valori RMSE si stabilizzavano di circa 300 fotogrammi per il gruppo di test. (B) La probabilità che un dato punto sia etichettato correttamente (media + SEM). Ciò ha dimostrato che 400 frame etichettati manualmente erano l'ideale perché i set di dati grezzi avevano una media superiore a 0,95 di probabilità, pur avendo un punteggio RMSE più vicino a quello dei dati di addestramento. Ciò significa che il modello è stato in grado di approssimare da vicino i punti su cui era stato addestrato, riportando anche la maggior parte dei fotogrammi con un'alta probabilità. Abbreviazione: RMSE = errore quadratico medio. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 4: Matrice di confusione per le misure di strabismo DLC. Abbiamo campionato 300 secondi da otto video (cinque CGRP e tre PBS) e abbiamo confrontato quei punti con un punteggio binario sì o no etichettato manualmente per strabismo. Abbiamo quantificato i valori previsti come quelli identificati dal DLC e i valori effettivi come quelli valutati manualmente da un essere umano. Abbiamo quindi confrontato questo con i dati con punteggio manuale per vedere con quale frequenza squint è stato identificato correttamente rispetto a quel binario con punteggio manuale sì o no di squint. Abbreviazioni: DLC = DeepLabCut; CGRP = peptide correlato al gene della calcitonina; PBS = soluzione salina tamponata con fosfato; TP = veri positivi; FP = falsi positivi; FN = falsi negativi; TN = veri negativi; PPV = valore predittivo positivo; VAN = valore predittivo negativo; TPR = tasso di vero positivo; TNR = tasso negativo vero; MCC = coefficiente di correlazione di Matthew. Clicca qui per visualizzare una versione più grande di questa figura.

Figura 5: Fenotipo dello strabismo in tre diversi modelli per il rilevamento dello strabismo. Le prime due righe contengono lo stesso animale rappresentativo con ciascuna condizione (PBS o CGRP) in tre diversi modelli per il rilevamento dello strabismo. La riga inferiore riflette le medie di tutti gli animali. (A) C'è stata una diminuzione dell'area media dei pixel (area media complessiva dei pixel/linea di base) nei topi trattati con CGRP rispetto a quelli trattati con PBS (t(18) = 2,805, p = 0,012) dopo aver elaborato tutti i dati utilizzando il modello di strabismo dell'area precedentemente pubblicato e convalidato14. (B) C'è stata una risposta simile nei dati con punteggio manuale (t(18) = 4,064, p = 0,0007). (C) I topi trattati con CGRP hanno mostrato una riduzione della distanza media da palpebra a palpebra (distanza euclidea di trattamento/distanza euclidea pretrattamento, basale) rispetto ai topi trattati con PBS (t(18) = 3,040, p = 0,007 quando si utilizza DLC per elaborare tutti i dati. N = 20 (10 femmine, 10 maschi). Le barre di errore indicano la media ± SEM. Fare clic qui per visualizzare una versione più grande di questa figura.