$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Aquí, proporcionamos un método para la detección confiable de estrabismo a alta resolución temporal utilizando DeepLabCut. Optimizamos los parámetros de entrenamiento y proporcionamos una evaluación de las fortalezas y debilidades de este método (Figura 1).
Después de entrenar nuestros modelos, comprobamos que eran capaces de estimar correctamente los puntos superior e inferior del párpado (Figura 2), que sirven como puntos de coordenadas para la medida de la distancia euclidiana. La distancia euclidiana se define como las longitudes medias de las distancias entre los dos puntos superior e inferior del ojo. Nuestro modelo fue capaz de detectar casos de no estrabismo (Figura 2A) y estrabismo (Figura 2B). Los puntos azules indican los puntos utilizados para determinar la distancia euclidiana para cada fotograma. Los puntos verdes, amarillos, naranjas y morados se utilizaron para ayudar al modelo a estimar correctamente la distancia euclidiana y disminuir el valor de probabilidad cuando la cabeza está en una posición subóptima (es decir, teniendo en cuenta el movimiento de la cabeza y los cambios de posición a lo largo de las sesiones). A continuación, validamos la precisión del modelo utilizando varios métodos diferentes.
Para validar el número ideal de fotogramas utilizados para el modelo, entrenamos y probamos cuatro modelos de diferentes tamaños de fotogramas de muestra (Figura 3). Primero comparamos los valores de error cuadrático medio (RMSE) entre los datos de prueba y de entrenamiento para validar qué tan bien los modelos podían predecir con precisión los datos de prueba con los que no habían sido entrenados. Esta comparación mostró que la variabilidad entre los puntos etiquetados manualmente y los puntos etiquetados con el modelo se estabilizó después de 300 fotogramas. Esta tendencia se correlacionó con los promedios informados para la probabilidad que también pareció estabilizarse después de 300 fotogramas etiquetados. Utilizamos estos valores de probabilidad informados para filtrar los puntos que eran inferiores a 0,92. Estos valores de probabilidad indican el grado de confianza del modelo en que un punto determinado se etiquetó correctamente en función de los datos de entrenamiento. Promediamos estos valores para los puntos que contribuyen a la métrica de distancia euclidiana para examinar qué tan bien se desempeñaron los modelos entre sí. Si bien no hubo una diferencia significativa entre 300 y 400 fotogramas, usamos 400 fotogramas porque promedió por encima del valor de probabilidad de 0,95, que se acerca a nuestro umbral para el filtrado manual y se alinea con el umbral utilizado en modelos similares para la estimación de pose16.
Otra forma en que validamos la precisión del modelo fue con una matriz de confusión que comparaba los fotogramas anotados manualmente con los fotogramas etiquetados con DLC. Dos individuos ciegos anotaron manualmente 300 fotogramas del mismo ojo en ocho vídeos. Utilizamos estos datos para construir una matriz de confusión para evaluar los verdaderos y falsos positivos y negativos (Figura 4), donde los datos puntuados manualmente se utilizaron como la verdad fundamental. Para DLC, se registró un valor positivo de estrabismo cuando la distancia euclidiana se registró como inferior a 75 píxeles (es decir, el animal entrecierra los ojos) y se registró un valor negativo para valores superiores a 75 píxeles (es decir, el animal no entrecierra los ojos). Encontramos un valor predictivo positivo del 96,96%, que es el porcentaje de tiempo que el modelo predice con precisión el estrabismo en relación con un estrabismo anotado manualmente. Encontramos un valor predictivo negativo del 99,66%, que es el porcentaje de tiempo que el modelo predice con precisión que no hay estrabismo en relación con el estrabismo anotado manualmente. Estos muestran la proporción de valores negativos y positivos que se etiquetaron correctamente. También encontramos una tasa de verdaderos positivos del 98,1% y una tasa de verdaderos negativos del 99,46%, que representan la predicción precisa del modelo de valores positivos y negativos en relación con todos los valores positivos y negativos, respectivamente. Nuestro coeficiente de correlación de Matthews, o MCC, fue del 93,8%, lo que indica el coeficiente de correlación entre los valores observados y los predichas.
Una vez que estuvimos seguros de que nuestro modelo rastrea de manera confiable el estrabismo, comparamos este método DLC con un método de seguimiento del estrabismo publicado anteriormente utilizando un conjunto de datos preclínicos de migraña14. Nos referiremos a este otro método como el "modelo de estrabismo de área (ASM)" porque se desarrolló utilizando el área de ojo abierto como variable continua que mide el estrabismo14. El modelo de estrabismo de área utiliza un software de detección facial entrenado combinado con un script personalizado de MATLAB para analizar el área media de píxeles del ojo y excluir los fotogramas con una tasa de error de seguimiento del >15%14. Una limitación importante es que el "ASM" no es de código abierto y, por lo tanto, no es ampliamente accesible. El contenido descargable permite una mayor optimización y adaptabilidad sin necesidad de una compra significativa de software y hardware.
Utilizamos un conjunto de datos de 10 ratones CD1 hembra y 10 machos. Experimentalmente, todos los animales fueron aclimatados en restricciones suaves durante 30 minutos durante un total de 3 días antes del inicio de las grabaciones. Cada animal fue registrado durante 5 min de la línea de base y luego 5 min para los registros de tratamiento. Durante las sesiones de tratamiento, los animales fueron tratados con PBS (vehículo) o 0,1 mg/kg de CGRP (tratamiento) por vía intraperitoneal para inducir un estado similar a la migraña. Los datos se recogieron en una habitación bien iluminada utilizando cámaras equipadas con luz infrarroja para iluminar el rostro, lo que garantizó una detección precisa de los puntos de referencia. La cámara infrarroja incluía un objetivo Kowa LM35JC 2/3" 35 mm con montura C de iris manual con una distancia focal de 254 mm y una apertura adecuadamente ajustada. Después de recopilar los datos, utilizamos el ASM y el DLC para analizar los datos. Dado que la puntuación manual se ha utilizado convencionalmente en el campo para cuantificar la mueca facial, siendo el estrabismo un componente de la mueca facial14, también comparamos nuestros datos con los datos puntuados manualmente.
Con base en hallazgos previos de que la inyección periférica de CGRP induce una respuesta de estrabismo en ratones, esperamos observar diferencias significativas en la respuesta de estrabismo entre el vehículo y el tratamiento con CGRP 6,14. Comparamos los métodos ASM, manual y DLC y descubrimos que nuestro modelo detectó de manera robusta un fenotipo de estrabismo, al igual que los métodos manual y ASM (Figura 5). Es importante tener en cuenta que se utilizó el modelo ASM para evaluar el dolor y el estrabismo inducidos por CGRP. En ese estudio, Rea et al. compararon la respuesta del estrabismo después de la CGRP con la respuesta del estrabismo después de la inyección de formalina de la pata trasera como un ensayo de inducción del dolor "más tradicional"14. Además, está bien documentado que el CGRP induce hipersensibilidad al tacto en ratones mediante el uso de von Frey 3,17. De acuerdo con el campo, normalizamos el estrabismo promedio durante la sesión de tratamiento a una línea de base de pretratamiento de 5 minutos para cada animal y comparamos los animales tratados con PBS (n = 10) con los animales tratados con CGRP (n = 11). A continuación se presentan los análisis estadísticos de los grupos tratados con PBS frente a los grupos tratados con CGRP. Encontramos que los animales tratados con CGRP exhibieron una disminución del área media de píxeles utilizando el método de seguimiento de estrabismo de área (p = 0.012, Figura 5A) y exhibieron una distancia euclidiana disminuida cuando se puntuaron manualmente (p = 0.0007, Figura 5B) y utilizando nuestro modelo DLC (p = 0.007, Figura 5C). Cuando comparamos cada método a lo largo del tiempo en un solo animal representativo, se observó el mismo patrón (Figura 5). Este animal mostró un fenotipo de estrabismo muy claro en respuesta al tratamiento con CGRP, pero no al PBS. Todos los modelos fueron capaces de detectar estas diferencias, pero los datos se representaron más claramente en nuestro modelo DLC (Figura 5). Las métricas precisas y precisas son especialmente importantes cuando los datos deben analizarse a resoluciones más finas en las que el promedio no es indicativo de la lectura completa del comportamiento (por ejemplo, la actividad cerebral). El método DLC para detectar el estrabismo en ratones nos permite recopilar datos en una escala de tiempo de milisegundos y bloquearlos en el tiempo con medidas de actividad cerebral (por ejemplo, potenciales de campo local), que ocurre en una escala de tiempo de milisegundos. A continuación, podemos utilizar esta técnica para construir un perfil más robusto de un estado cerebral indicativo de dolor espontáneo en el contexto de la migraña y otros trastornos cerebrales complejos.

Figura 1: Descripción general del procedimiento para generar una red entrenada con DLC. Esquema general del proceso por el cual se rastrean las características oculares de un animal y luego se analizan mediante aprendizaje automático. Abreviatura: DLC = DeepLabCut. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Ejemplo de seguimiento automatizado del estrabismo en un ratón CD1 representativo. (A) Ejemplo de un fotograma que muestra el estrabismo de seguimiento DLC (puntos de colores) en el contorno del ojo durante el día del tratamiento cuando el ratón no está entrecerrando los ojos. (B) Ejemplo de un fotograma que muestra la detección automatizada de estrabismo el día del tratamiento, utilizando nuestro modelo DLC. La distancia euclidiana se midió utilizando la distancia media entre B y C, los puntos azules, en la parte superior e inferior del ojo. Los conjuntos de puntos azules en la parte superior e inferior del ojo se utilizan cuando se rastrea la distancia euclidiana. Los otros puntos (verde, amarillo, naranja, morado) son puntos de referencia de encuadre utilizados para ayudar al modelo a estimar los puntos de distancia euclidiana y filtrar el posicionamiento subóptimo de la cabeza después de la recopilación de datos. Abreviatura: DLC = DeepLabCut. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3: Justificación del número de fotogramas utilizados para entrenar el modelo. (A) El análisis de error cuadrático medio indica la distancia media entre los valores previstos y observados para los conjuntos de datos de prueba y entrenamiento. El conjunto de datos de entrenamiento representa los fotogramas muestreados al entrenar el modelo, y el conjunto de datos de prueba representa los fotogramas que no son de entrenamiento utilizados para validar el grado en que el modelo podría identificar imágenes similares pero diferentes. Utilizamos cinco conjuntos de datos de entrenamiento y prueba y descubrimos que los valores de RMSE se nivelaron alrededor de 300 fotogramas para el grupo de prueba. (B) La probabilidad de que un punto dado esté correctamente etiquetado (media + SEM). Esto mostró que 400 fotogramas etiquetados manualmente eran ideales porque los conjuntos de datos sin procesar tenían un promedio superior a 0,95 de probabilidad, mientras que tenían una puntuación RMSE más cercana a la de los datos de entrenamiento. Esto significó que el modelo pudo aproximarse de cerca a los puntos en los que había sido entrenado y, al mismo tiempo, informar sobre la mayoría de los fotogramas con una alta probabilidad. Abreviatura: RMSE = error cuadrático de la media radicular. Haga clic aquí para ver una versión más grande de esta figura.

Figura 4: Matriz de confusión para las mediciones de estrabismo DLC. Tomamos una muestra de 300 s de ocho videos (cinco CGRP y tres PBS) y comparamos esos puntos con una puntuación binaria de sí o no etiquetada manualmente para el estrabismo. Cuantificamos los valores predichos como los identificados por DLC y los valores reales como los puntuados manualmente por un humano. A continuación, comparamos esto con los datos puntuados manualmente para ver con qué frecuencia el estrabismo se identificó correctamente en relación con el sí o el no binario puntuado manualmente del estrabismo. Abreviaturas: DLC = DeepLabCut; CGRP = péptido relacionado con el gen de la calcitonina; PBS = solución salina tamponada con fosfato; TP = verdaderos positivos; FP = falsos positivos; FN = falsos negativos; TN = negativos verdaderos; VPP = valor predictivo positivo; VAN = valor predictivo negativo; TPR = tasa de verdaderos positivos; TNR = tasa negativa verdadera; MCC = coeficiente de correlación de Matthew. Haga clic aquí para ver una versión más grande de esta figura.

Figura 5: Fenotipo de estrabismo en tres modelos diferentes para detectar el estrabismo. Las dos filas superiores contienen el mismo animal representativo con cada condición (PBS o CGRP) en tres modelos diferentes para detectar el estrabismo. La fila inferior refleja los promedios de todos los animales. (A) Hubo una disminución en el área media de píxeles (área media total de píxeles/línea de base) en ratones tratados con CGRP frente a ratones tratados con PBS (t(18) = 2,805, p = 0,012) después de procesar todos los datos utilizando el modelo de estrabismo de área previamente publicado y validado14. (B) Hubo una respuesta similar en los datos puntuados manualmente (t(18) = 4,064, p = 0,0007). (C) Los ratones tratados con CGRP mostraron una menor distancia promedio de párpado a párpado (distancia euclidiana del tratamiento/distancia euclidiana previa al tratamiento, línea de base) que los ratones tratados con PBS (t(18) = 3.040, p = 0.007 cuando utilizaron DLC para procesar todos los datos. N = 20 (10 hembras, 10 machos). Las barras de error indican la media ± SEM. Haga clic aquí para ver una versión más grande de esta figura.