$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Hier bieden we een methode voor de betrouwbare detectie van scheelzien bij hoge temporele resolutie met behulp van DeepLabCut. We hebben de trainingsparameters geoptimaliseerd en we geven een evaluatie van de sterke en zwakke punten van deze methode (Figuur 1).
Nadat we onze modellen hadden getraind, hebben we geverifieerd dat ze in staat waren om de bovenste en onderste punten van het ooglid correct te schatten (Figuur 2), die dienen als de coördinaatpunten voor de Euclidische afstandsmeting. De Euclidische afstand wordt gedefinieerd als de gemiddelde lengte van de afstanden tussen de twee bovenste en onderste punten van het oog. Ons model was in staat om gevallen van niet-scheelzien (Figuur 2A) en scheelzien (Figuur 2B) te detecteren. De blauwe stippen geven de punten aan die worden gebruikt om de Euclidische afstand voor elk frame te bepalen. De groene, gele, oranje en paarse stippen werden gebruikt om het model te helpen de Euclidische afstand correct te schatten en de waarschijnlijkheidswaarde te verlagen wanneer het hoofd zich in een suboptimale positie bevindt (d.w.z. rekening houdend met hoofdbewegingen en positieveranderingen tijdens sessies). Vervolgens hebben we de nauwkeurigheid van het model gevalideerd met behulp van een aantal verschillende methoden.
Om het ideale aantal frames dat voor het model wordt gebruikt te valideren, hebben we vier modellen met verschillende voorbeeldframegroottes getraind en getest (Afbeelding 3). We hebben eerst de RMSE-waarden (Root Average Square Error) tussen de test- en trainingsgegevens vergeleken om te valideren hoe goed de modellen testgegevens nauwkeurig konden voorspellen waarop ze niet waren getraind. Uit deze vergelijking bleek dat de variabiliteit tussen de handmatig gelabelde punten en de modelgelabelde punten na 300 frames afvlakte. Deze trend correleerde met de gerapporteerde gemiddelden voor waarschijnlijkheid die ook leken af te vlakken na 300 gelabelde frames. We hebben deze gerapporteerde waarschijnlijkheidswaarden gebruikt om punten te filteren die kleiner waren dan 0,92. Deze waarschijnlijkheidswaarden geven aan hoe zeker het model is dat een bepaald punt correct is gelabeld op basis van de trainingsgegevens. We hebben het gemiddelde genomen van deze waarden voor de punten die bijdragen aan de Euclidische afstandsmetriek om te onderzoeken hoe goed de modellen ten opzichte van elkaar presteerden. Hoewel er geen significant verschil was tussen 300 en 400 frames, gebruikten we 400 frames omdat dit gemiddeld boven de waarschijnlijkheidswaarde van 0,95 lag, wat onze drempel voor handmatig filteren nadert en overeenkomt met de drempel die wordt gebruikt in vergelijkbare modellen voor pose-schatting16.
Een andere manier waarop we de nauwkeurigheid van het model hebben gevalideerd, was met een verwarringsmatrix waarin handmatig geannoteerde frames werden vergeleken met frames met DLC-labels. Twee geblindeerde personen annoteerden handmatig 300 frames van hetzelfde oog in acht video's. We gebruikten deze gegevens om een verwarringsmatrix te construeren om echte en onwaar-positieven en -negatieven te beoordelen (Figuur 4), waarbij handmatig gescoorde gegevens werden gebruikt als de grondwaarheid. Voor DLC werd een positieve scheelzienswaarde geregistreerd wanneer de Euclidische afstand werd geregistreerd als minder dan 75 pixels (d.w.z. het dier loenst) en een negatieve waarde werd geregistreerd voor waarden groter dan 75 pixels (d.w.z. het dier knijpt niet scheel). We vonden een positief voorspellende waarde van 96,96%, wat het percentage van de tijd is dat het model scheelzien nauwkeurig voorspelt ten opzichte van een handmatig geannoteerde scheelzien. We vonden een negatief voorspellende waarde van 99,66%, wat het percentage van de tijd is dat het model nauwkeurig geen scheelzien voorspelt ten opzichte van handmatig geannoteerde scheelzien. Deze tonen het aandeel negatieve en positieve waarden dat correct is gelabeld. We vonden ook een echt positief percentage van 98,1% en een echt negatief percentage van 99,46%, die de nauwkeurige voorspelling van het model van positieve en negatieve waarden vertegenwoordigen ten opzichte van respectievelijk alle positieve en negatieve waarden. Onze Matthews-correlatiecoëfficiënt, of MCC, was 93,8%, wat de correlatiecoëfficiënt aangeeft tussen waargenomen en voorspelde waarden.
Toen we er eenmaal zeker van waren dat ons model scheelzien op betrouwbare wijze volgt, vergeleken we deze DLC-methode met een eerder gepubliceerde methode voor het volgen van scheelzien met behulp van een preklinische migrainedataset14. We zullen naar deze andere methode verwijzen als het "area squint model (ASM)" omdat het is ontwikkeld met behulp van open ogen als de continue variabele die scheelheid14 meet. Het gebiedsloenschildmodel maakt gebruik van getrainde gezichtsdetectiesoftware in combinatie met een aangepast MATLAB-script om het gemiddelde pixelgebied van het oog te analyseren, terwijl frames met een volgfoutpercentage van >15%14 worden uitgesloten. Een belangrijke beperking is dat de "ASM" niet open source is en daarom niet algemeen toegankelijk. DLC zorgt voor meer optimalisatie en aanpasbaarheid zonder dat er een aanzienlijke aankoop van software en hardware nodig is.
We gebruikten een dataset van 10 vrouwelijke en 10 mannelijke CD1-muizen. Experimenteel werden alle dieren gedurende 30 minuten gedurende in totaal 3 dagen voorafgaand aan het begin van de opnames geacclimatiseerd in zachte beperkingen. Elk dier werd geregistreerd gedurende 5 minuten van de basislijn en vervolgens 5 minuten voor behandelingsopnames. Tijdens behandelingssessies werden dieren intraperitoneaal behandeld met PBS (medium) of 0,1 mg/kg CGRP (behandeling) om een migraine-achtige toestand op te wekken. Gegevens werden verzameld in een goed verlichte kamer met behulp van camera's uitgerust met infrarood licht om het gezicht te verlichten, waardoor een nauwkeurige herkenningspuntdetectie werd gegarandeerd. De infraroodcamera bevatte een Kowa LM35JC 2/3" 35 mm F1.6 handmatige iris C-mount lens met een brandpuntsafstand van 254 mm en een passend aangepast diafragma. Nadat we de gegevens hadden verzameld, gebruikten we de ASM en DLC om de gegevens te analyseren. Aangezien handmatig scoren in het veld conventioneel is gebruikt om gezichtsgrimas te kwantificeren, waarbij scheelzien een onderdeel is van de gezichtsgrimas14, hebben we onze gegevens ook vergeleken met handmatig gescoorde gegevens.
Op basis van eerdere bevindingen dat perifere injectie van CGRP een scheelziende respons bij muizen induceert, verwachtten we significante verschillen in scheelziende respons tussen vehiculeuze en CGRP-behandeling waar te nemen 6,14. We vergeleken ASM-, handmatige- en DLC-methoden en ontdekten dat ons model robuust een scheelziend fenotype detecteerde, net als de handmatige en ASM-methoden (Figuur 5). Het is belangrijk op te merken dat het ASM-model werd gebruikt om door CGRP geïnduceerde pijn en scheelzien te beoordelen. In die studie vergeleken Rea et al. scheelziende respons na CGRP met scheelzienrespons na formaline-injectie van de achterpoot als een "meer traditionele" pijninductietest14. Bovendien is CGRP goed gedocumenteerd als het induceren van overgevoeligheid voor aanraking bij muizen door het gebruik van von Frey 3,17. In overeenstemming met het veld normaliseerden we de gemiddelde scheelzien tijdens de behandelingssessie naar een basislijn van 5 minuten vóór de behandeling voor elk dier en vergeleken we PBS (n = 10) versus met CGRP behandelde (n = 11) dieren. Statistische analyses van de PBS- versus CGRP-behandelde groepen zijn als volgt. We ontdekten dat met CGRP behandelde dieren een verminderd gemiddeld pixelgebied vertoonden met behulp van de gebiedsloenstmethode voor het volgen (p = 0,012, figuur 5A) en een verminderde Euclidische afstand vertoonden wanneer ze handmatig werden gescoord (p = 0,0007, figuur 5B) en met behulp van ons DLC-model (p = 0,007, figuur 5C). Toen we elke methode in de loop van de tijd vergeleken in een enkel representatief dier, werd hetzelfde patroon waargenomen (Figuur 5). Dit dier vertoonde een zeer duidelijk scheelziend fenotype als reactie op CGRP-behandeling, maar niet op PBS. Alle modellen waren in staat om deze verschillen te detecteren, maar de gegevens waren het duidelijkst weergegeven in ons DLC-model (Figuur 5). Nauwkeurige en nauwkeurige statistieken zijn vooral belangrijk wanneer gegevens met fijnere resoluties moeten worden geanalyseerd waarbij het gemiddelde niet indicatief is voor de volledige gedragsuitlezing (bijv. hersenactiviteit). De DLC-methode voor het detecteren van scheelzien bij muizen stelt ons in staat om gegevens te verzamelen op een tijdschaal van milliseconden en deze te koppelen aan metingen van hersenactiviteit (bijv. Lokale veldpotentialen), die plaatsvindt op een tijdschaal van milliseconden. We kunnen deze techniek vervolgens gebruiken om een robuuster profiel op te bouwen van een hersentoestand die wijst op spontane pijn in de context van migraine en andere complexe hersenaandoeningen.

Figuur 1: Overzicht van de procedure voor het genereren van een getraind netwerk met DLC. Algemeen schema van het proces waarbij oogkenmerken van een dier worden gevolgd en vervolgens worden geanalyseerd met behulp van machine learning. Afkorting: DLC = DeepLabCut. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 2: Voorbeeld van geautomatiseerde scheel kijken in een representatieve CD1-muis. (A) Voorbeeld van een frame met DLC-tracking-loensen (gekleurde stippen) op de omtrek van het oog tijdens de behandelingsdag wanneer de muis niet loenst. (B) Voorbeeld van een frame met geautomatiseerde detectie van scheelzien op de behandelingsdag, met behulp van ons DLC-model. De Euclidische afstand werd gemeten aan de hand van de gemiddelde afstand tussen B en C, de blauwe stippen, aan de boven- en onderkant van het oog. De blauwe reeksen stippen aan de boven- en onderkant van het oog worden gebruikt bij het volgen van de Euclidische afstand. De andere punten (groen, geel, oranje, paars) zijn kaderoriëntatiepunten die worden gebruikt om het model te helpen bij het schatten van de Euclidische afstandspunten en om suboptimale hoofdpositionering na gegevensverzameling uit te filteren. Afkorting: DLC = DeepLabCut. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 3: Rechtvaardiging voor het aantal frames dat is gebruikt om het model te trainen. (A) Root-mean squared error-analyse geeft de gemiddelde afstand aan tussen voorspelde en waargenomen waarden voor test- en treindatasets. De trainingsgegevensset vertegenwoordigt de frames die zijn bemonsterd bij het trainen van het model en de testgegevensset vertegenwoordigt de niet-trainingsframes die worden gebruikt om te valideren hoe goed het model vergelijkbare maar verschillende afbeeldingen kan identificeren. We gebruikten vijf sets trainings- en testgegevens en ontdekten dat de RMSE-waarden voor de testgroep ongeveer 300 frames afvlakten. (B) De waarschijnlijkheid dat een bepaald punt correct is geëtiketteerd (gemiddelde + SEM). Hieruit bleek dat 400 handmatig gelabelde frames ideaal waren omdat de onbewerkte datasets gemiddeld meer dan 0,95 waarschijnlijkheid hadden, terwijl ze een RMSE-score hadden die het dichtst bij die van de trainingsgegevens lag. Dit betekende dat het model in staat was om de punten waarop het was getraind nauwkeurig te benaderen, terwijl het ook met een hoge waarschijnlijkheid over de meeste frames rapporteerde. Afkorting: RMSE = root-mean squared error. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 4: Verwarringsmatrix voor DLC-loensenmetingen. We hebben 300 s uit acht video's (vijf CGRP en drie PBS) gesampled en die punten vergeleken met een handmatig gelabelde binaire ja- of nee-score voor scheelzien. We hebben voorspelde waarden gekwantificeerd als die geïdentificeerd door DLC en werkelijke waarden als waarden die handmatig zijn gescoord door een mens. Vervolgens vergeleken we dit met de handmatig gescoorde gegevens om te zien hoe vaak scheelzien correct werd geïdentificeerd ten opzichte van dat handmatig gescoorde binaire ja of nee van scheelzien. Afkortingen: DLC = DeepLabCut; CGRP = calcitonine-gen-gerelateerd peptide; PBS = fosfaatgebufferde zoutoplossing; TP = echte positieven; FP = valse positieven; FN = valse negatieven; TN = echte negatieven; PPV = positief voorspellende waarde; NPV = negatief voorspellende waarde; TPR = echt positief percentage; TNR = echt negatief percentage; MCC = de correlatiecoëfficiënt van Mattheüs. Klik hier om een grotere versie van deze figuur te bekijken.

Figuur 5: Fenotype van scheelzien in drie verschillende modellen voor het detecteren van scheelzien. De bovenste twee rijen bevatten hetzelfde representatieve dier met elke aandoening (PBS of CGRP) in drie verschillende modellen voor het detecteren van scheelzien. De onderste rij geeft de gemiddelden van alle dieren weer. (A) Er was een afname van het gemiddelde pixeloppervlak (gemiddeld totaal pixelgebied/baseline) bij met CGRP behandelde versus PBS-behandelde muizen (t(18) = 2,805, p = 0,012) na verwerking van alle gegevens met behulp van het eerder gepubliceerde en gevalideerde gebiedsloenstmodel14. (B) Er was een vergelijkbare respons in handmatig gescoorde gegevens (t(18) = 4,064, p = 0,0007). (C) Met CGRP behandelde muizen vertoonden een verminderde gemiddelde afstand tussen ooglid en ooglid (Euclidische afstand van de behandeling/Euclidische afstand vóór de behandeling, baseline) dan met PBS behandelde muizen (t(18) = 3,040, p = 0,007 bij gebruik van DLC om alle gegevens te verwerken. N = 20 (10 vrouwen, 10 mannen). Foutbalken geven de gemiddelde ± SEM aan. Klik hier om een grotere versie van deze figuur te bekijken.