このプロトコルは、神経生理学的測定へのタイムロックと互換性のある方法で、げっ歯類の自動眼斜視を経時的に追跡する方法を提供します。このプロトコールは、片頭痛などの疼痛障害のメカニズムを研究する研究者にとって有用であると期待されています。
Method Article
このプロトコルは、神経生理学的測定へのタイムロックと互換性のある方法で、げっ歯類の自動眼斜視を経時的に追跡する方法を提供します。このプロトコールは、片頭痛などの疼痛障害のメカニズムを研究する研究者にとって有用であると期待されています。
自然発生的な痛みをリアルタイムで追跡し、人間の偏見を防ぐ方法で定量化することは困難でした。これは、片頭痛などの障害のように、頭の痛みの指標に特に当てはまります。Eye Squintは、経時的に測定できる連続変数の指標として登場し、このようなアッセイの痛みの状態を予測するのに効果的です。この論文では、DeepLabCut(DLC)を使用して、頭を自由に回転する拘束マウスの眼斜視(まぶた間のユークリッド距離)を自動化および定量化するためのプロトコルを提供します。このプロトコルにより、眼の斜視の偏りのない定量化を、神経生理学などのメカニズム測定と直接組み合わせて比較することができます。私たちは、斜視期間と非斜視期間を区別することによって定義される成功を達成するために必要なAIトレーニングパラメータの評価を提供します。私たちは、CGRP によって誘発された片頭痛様表現型の斜視を 1 秒未満の解像度で確実に追跡し、区別する能力を示しています。
片頭痛は、世界中で最も蔓延している脳疾患の1つであり、10億人以上が罹患しています1。片頭痛の前臨床マウスモデルは、片頭痛のメカニズムを研究するための有益な方法として浮上しており、これらの研究は人間の研究よりも簡単に制御できるため、片頭痛関連行動の因果関係の研究が可能になります2。このようなモデルは、カルシトニン遺伝子関連ペプチド(CGRP)などの片頭痛誘発化合物に対して強力で再現性のある表現型応答を示しています。げっ歯類モデルにおける片頭痛関連行動の堅牢な測定の必要性は依然としてあり、特にイメージングや電気生理学的アプローチなどのメカニズムメトリックと組み合わせる可能性のあるもの。
片頭痛様の脳の状態は、光嫌悪、足異痛症、有害な刺激に対する顔面痛覚過敏、および顔面のしかめっ面の存在によって表現型的に特徴付けられてきました3。このような行動は、光に費やされた合計時間(光嫌悪)と足または顔の接触感度の閾値(足の異痛症および顔面痛覚過敏)によって測定され、長時間(数分以上)にわたる1回の読み出しに制限されます。片頭痛様行動は、CGRPのような片頭痛誘発化合物を投与することにより、動物において誘発することができ、片頭痛3のヒト患者が経験する症状を模倣する(すなわち、顔面の有効性を示す)。このような化合物は、ヒトに投与すると片頭痛の症状も引き起こし、これらのモデルの構成概念の有効性を実証しています4。行動表現型が薬理学的に減衰した研究は、片頭痛の治療に関連する発見につながり、これらのモデルのさらなる実証を提供します(つまり、予測妥当性を実証します)5,6。
例えば、モノクローナル抗CGRP抗体(ALD405)は、CGRPで治療したマウスにおいて、光嫌悪行動5および顔面のしかめっ面6を軽減することが示され、他の研究では、CGRP拮抗薬が動物における亜酸化窒素誘発性片頭痛様行動を減少させることが示されている7,8。最近の臨床試験では、CGRP 9,10 をブロックすることで片頭痛の治療に成功し、CGRP またはその受容体を標的とする複数の FDA 承認薬が誕生しています。片頭痛関連の表現型の前臨床評価は、臨床所見のブレークスルーにつながったため、ヒトで直接テストするのが難しい片頭痛のより複雑な側面のいくつかを理解するために不可欠です。
多くの利点があるにもかかわらず、これらの片頭痛のげっ歯類の行動測定値を使用した実験は、多くの場合、その時点のサンプリング能力に制限されており、主観的であり、人間の実験エラーが発生しやすい可能性があります。多くの行動アッセイは、より細かい時間分解能で活動を捕捉する能力に限界があり、多くの場合、脳活動のレベルなど、サブ秒の時間スケールで発生するより動的な要素を捕捉することが困難になります。神経生理学的メカニズムを研究するために、時間の経過とともに行動のより自発的で自然に発生する要素を意味のある時間分解能で定量化することは困難であることが証明されています。片頭痛様の活動をより速い時間スケールで特定する方法を作成することで、片頭痛様の脳の状態を外部から検証することが可能になる。これを脳活動と同期させることで、片頭痛のより強固な脳活動プロファイルを作成することができる。
そのような片頭痛関連の表現型の1つである顔のしかめっ面は、動物の痛みの測定としてさまざまな状況で利用されており、これは瞬時に測定でき、経時的に追跡できる11。顔のしかめっ面は、人間(特に非言語的な人間)や他の哺乳類種が痛みを経験するときに顔の表情に自然な変化を示すという考えに基づいて、自発的な痛みの指標としてよく使用されます11。過去10年間にマウスの痛みの指標として顔面のしかめっ面を測定した研究では、げっ歯類の痛みの特徴付けを標準化するためにマウスしかめっ面スケール(MGS)などのスケールが利用されてきた12。MGSの表情変数には、眼窩引き締め(斜視)、鼻の膨らみ、頬の膨らみ、耳の位置、ひげの変化などがあります。MGSは動物の痛みを確実に特徴付けることが示されています13が、それは主観的であることで有名であり、正確なスコアリングに依存しており、これは実験者によって異なる可能性があります。さらに、MGSは非連続スケールを利用し、時間を超えて自然に発生する行動を追跡するために必要な時間分解能を欠いているという点で制限があります。
これに対処する1つの方法は、一貫した顔の特徴を客観的に定量化することです。斜視は、最も一貫して追跡可能な顔の特徴です6。すべての MGS 変数 (斜視、鼻の膨らみ、頬の膨らみ、耳の位置、ひげの変化) を考慮すると、斜視はデータの総変動性の大部分を占めます6。斜視は、MGS を使用して得られる全体的なスコアに最も寄与し、CGRP 6,14 に対する反応を確実に追跡するため、片頭痛マウス モデルにおける自発的な痛みを追跡する最も信頼性の高い方法です。これにより、スクインはCGRPによって誘発される定量化可能な非恒常性行動になります。いくつかの研究室では、片頭痛に関連する潜在的な自発的な痛みを表すために、斜視を含む顔の表情の特徴を使用しています6,15。
片頭痛のメカニズム研究と組み合わせることができる方法で自動化された斜視を実施することに関して、いくつかの課題が残っています。例えば、セッション間で同じようにキャリブレーションする必要がある固定位置に頼らずに、スクイントを確実に追跡することは困難でした。また、MGSのような離散的なスケールではなく、連続的なスケールでこの種の解析を行うことができることも課題です。これらの課題を軽減するために、私たちはDeepLabCut(DLC)という形で機械学習をデータ分析パイプラインに統合することを目指しました。DLCは、Mathisらによって開発された姿勢推定機械学習モデルであり、幅広い行動に適用されている16。彼らの姿勢推定ソフトウェアを使用して、マウスの目の点を人間に近い精度で正確に予測できるモデルをトレーニングすることができました。これにより、反復的な手動スコアリングの問題が解決されると同時に、時間分解能が大幅に向上します。さらに、これらのモデルを作成することにより、より大きな実験グループで片頭痛のような脳活動を推定し、斜視をスコアリングするための再現性のある手段を作成しました。ここでは、神経生理学などの他のメカニズム測定に時間ロックできる方法で斜視行動を追跡するためのこの方法の開発と検証を紹介します。包括的な目標は、げっ歯類モデルで時間ロックされた斜視行動を必要とする機構研究を触媒することです。
注:これらの実験で使用されたすべての動物は、アイオワ大学の動物管理および使用委員会(IACUC)によって承認されたプロトコルに従って取り扱われました。
1. データ収集のための機器を準備する
2. DLCの設定
3. モデルを作成する
4. 設定を構成する
注: ここでは、追跡するポイント、各トレーニング ビデオから抽出するフレーム数、既定のラベル付けドット サイズ、モデルのトレーニング方法に関連する変数などの詳細を定義できます。
5. トレーニング フレームの抽出
6. トレーニングフレームにラベルを付ける
7. トレーニング データセットを作成する
8. ネットワークを評価する
9.データの分析/ラベル付きビデオの生成
10. 最終データの処理
ここでは、DeepLabCutを使用して、高い時間分解能で斜視を確実に検出する方法を提供します。トレーニングパラメータを最適化し、この方法の長所と短所の評価を提供します(図1)。
モデルをトレーニングした後、ユークリッド距離測定の座標点として機能するまぶたの上部と下部の点(図2)を正しく推定できることを確認しました。ユークリッド距離は、目の上点と下点の 2 つの点の間の距離の平均の長さとして定義されます。私たちのモデルは、非斜視(図2A)と斜視(図2B)のインスタンスを検出することができました。青い点は、各フレームのユークリッド距離を決定するために使用される点を示しています。緑、黄、オレンジ、紫の点は、モデルがユークリッド距離を正しく推定し、頭が最適でない位置にあるとき (つまり、頭の動きとセッション間での位置の変化を考慮した) の尤度値を減らすために使用されました。次に、さまざまな方法を使用してモデルの精度を検証しました。
モデルに使用した理想的なフレーム数を検証するために、サンプルフレームサイズの異なる4つのモデルをトレーニングしてテストしました(図3)。まず、テストデータとトレーニングデータの間で二乗平均平方根誤差(RMSE)の値を比較し、モデルがトレーニングされていないテストデータを正確に予測できるかを検証しました。この比較により、手動でラベル付けされたポイントとモデルでラベル付けされたポイントの間の変動は、300フレーム後に横ばいになることが示されました。この傾向は、報告された尤度の平均と相関しており、これもラベル付きフレームが 300 個ある後に横ばいになったように見えました。これらの報告された尤度値を使用して、0.92未満のポイントをフィルタリングしました。これらの尤度値は、特定のポイントがトレーニング データに基づいて正しくラベル付けされたというモデルの信頼性を示します。これらの値をユークリッド距離メトリックに寄与するポイントについて平均化して、モデルが互いにどの程度うまく機能したかを調べました。300 フレームと 400 フレームの間に有意差はありませんでしたが、400 フレームを使用したのは、平均が 0.95 の尤度値を超えており、手動フィルタリングのしきい値に近く、姿勢推定の同様のモデルで使用されるしきい値と一致しているためです16。
モデルの精度を検証する別の方法は、手動で注釈が付けられたフレームとDLCラベルが付けられたフレームを比較する混同行列を使用することでした。盲目の2人の人物が、8つのビデオで同じ目の300フレームに手動で注釈を付けました。これらのデータを使用して、真陽性と偽陽性、および否定性を評価するための混同行列を構築しました(図4)、手動でスコアリングされたデータをグラウンドトゥルースとして使用しました。DLCでは、ユークリッド距離が75ピクセル未満(つまり、動物が斜視する)として記録された場合は正の斜視値が記録され、75ピクセルを超える値(つまり、動物が斜視しない)に対しては負の値が記録されました。96.96%の正の予測値が得られましたが、これは、手動で注釈が付けられた斜視と比較して、モデルが斜視を正確に予測する時間の割合です。99.66%の負の予測値を見つけましたが、これは、モデルが手動で注釈付けされた斜視と比較して斜視が正確に予測されない時間の割合です。これらは、正しくラベル付けされた負の値と正の値の割合を示しています。また、真陽性率が98.1%、真陰性率が99.46%であることもわかり、これらは、それぞれ正の値と負の値に対するモデルの正の値と負の値の正確な予測を表しています。マシューズ相関係数(MCC)は93.8%で、観測値と予測値の間の相関係数を示しています。
モデルが斜視を確実に追跡すると確信したため、このDLC法を、前臨床片頭痛データセット14を使用して以前に発表された斜視追跡法と比較しました。この他の方法は、連続変数測定斜視14として開眼領域を使用して開発されたため、「エリア斜視モデル(ASM)」と呼ぶ。エリア スクイント モデルは、学習済みの顔検出ソフトウェアとカスタム MATLAB スクリプトを組み合わせて、トラッキング エラー率が >15% のフレームを除外しながら、目の平均ピクセル面積を解析します14。大きな制限の 1 つは、「ASM」がオープンソースではないため、広くアクセスできないことです。DLCは、ソフトウェアやハードウェアを大量に購入することなく、最適化と適応性を高めることができます。
10匹の女性と10匹の男性のCD1マウスのデータセットを使用しました。実験的に、すべての動物を、記録開始の3日前に合計30分間、穏やかな拘束具に順応させました。各動物は、ベースラインの 5 分間、その後治療の記録のために 5 分間記録されました。治療セッション中、動物はPBS(ビヒクル)または0.1 mg / kg CGRP(治療)のいずれかで腹腔内治療され、片頭痛様状態を誘発されました。.データは、赤外線を搭載したカメラを使用して顔を照らし、明るい部屋でデータを収集し、正確なランドマーク検出を確保しました。赤外線カメラには、焦点距離254mm、絞りを適切に調整したKowa LM35JC 2/3" 35 mm F1.6マニュアルアイリスCマウントレンズが含まれていました。データを収集した後、ASMとDLCを活用してデータを分析しました。手動採点は、顔のしかめっ面を定量化するために現場では従来から利用されており、顔のしかめっ面14の1つの要素である斜視も使用されていたため、データを手動で採点したデータと比較しました。
CGRPの末梢注射がマウスにおいて斜視反応を誘発するという以前の知見に基づき、我々は、ビヒクルとCGRP治療との間の斜視反応の有意差を観察すると予想した6,14。ASM、手動、DLCの方法を比較したところ、手動法とASM法と同様に、モデルが斜視表現型を確実に検出することがわかりました(図5)。ASMモデルは、CGRPによる痛みと斜視の評価に使用されたことに注意することが重要です。その研究では、Rea らは、「より伝統的な」疼痛誘発アッセイとして、CGRP 後の斜視反応と後足へのホルマリン注射後の斜視反応を比較しました14。さらに、CGRP は、フォン フレイ 3,17 を使用してマウスの触覚過敏症を誘発することが十分に文書化されています。フィールドと一致して、治療セッション中の平均斜視を各動物の治療前ベースライン5分に正規化し、PBS(n = 10)とCGRP処理(n = 11)動物を比較しました。PBS群とCGRP治療群の統計解析は以下の通りである。CGRP処理された動物は、エリアスクイント法の追跡法(p = 0.012、図5A)を使用して平均ピクセル面積が減少し、手動でスコアリング(p = 0.0007、図5B)し、DLCモデル(p = 0.007、図5C)を使用するとユークリッド距離が減少することがわかりました。各方法を1つの代表的な動物で経時的に比較したところ、同じパターンが観察されました(図5)。この動物は、CGRP治療に反応して非常に明確な斜視表現型を示しましたが、PBSには反応しませんでした。すべてのモデルでこれらの違いを検出できましたが、データはDLCモデルで最も明確に表現されていました(図5)。正確で正確なメトリクスは、平均化が完全な行動測定値(脳活動など)を示さないような、より細かい解像度でデータを分析する必要がある場合に特に重要です。マウスの斜視を検出するDLC法により、ミリ秒のタイムスケールでデータを収集し、ミリ秒のタイムスケールで発生する脳活動の測定値(局所電位など)にタイムロックすることができます。その後、この手法を利用して、片頭痛やその他の複雑な脳障害の文脈で自発的な痛みを示す脳状態のより堅牢なプロファイルを構築できます。

図1:DLCを使用して学習済みネットワークを生成する手順の概要。 動物の目の特徴を追跡し、機械学習を使用して分析するプロセスの一般的な概略図。略語:DLC=DeepLabCut。 この図の拡大版を表示するには、ここをクリックしてください。

図2:代表的なCD1マウスにおける自動斜視追跡の例。 (A)マウスが目を細めていない治療日中に、目の輪郭にDLCトラッキング斜視(色付きの点)を示すフレームの例。(B)DLCモデルを使用した、治療当日の斜視の自動検出を示すフレームの例。ユークリッド距離は、目の上と下にある青い点であるBとCの間の平均距離を使用して測定されました。目の上と下にある青いドットのセットは、ユークリッド距離を追跡するときに使用されます。他のポイント (緑、黄、オレンジ、紫) は、モデルがユークリッド距離ポイントを推定し、データ収集後に最適でないヘッド位置を除外するために使用されるフレーミング ランドマークです。略語:DLC=DeepLabCut。 この図の拡大版を表示するには、ここをクリックしてください。

図3:モデルのトレーニングに使用されるフレーム数の正当化。 (A)二乗平均平方根誤差分析は、テストデータセットとトレーニングデータセットの予測値と観測値の間の平均距離を示します。トレーニング データ セットは、モデルのトレーニング時にサンプリングされたフレームを表し、テスト データ セットは、モデルが類似しているが異なるイメージをどの程度適切に識別できるかを検証するために使用される非トレーニング フレームを表します。5セットのトレーニングデータとテストデータを使用し、テストグループではRMSE値が約300フレームで横ばいになることがわかりました。(B)特定のポイントが正しくラベル付けされている可能性(平均+ SEM)。これにより、手動でラベル付けされた 400 個のフレームが理想的であることが示されました。これは、生データ セットの平均が 0.95 尤度を超え、RMSE スコアがトレーニング データの RMSE スコアに最も近いためです。これは、モデルがトレーニングされたポイントを厳密に近似すると同時に、高い確率でほとんどのフレームについてレポートできたことを意味します。略語:RMSE =二乗平均平方根誤差。 この図の拡大版を表示するには、ここをクリックしてください。

図4:DLCスクイント測定の混同行列。 8つのビデオ(CGRP5つとPBS3つ)から300秒をサンプリングし、それらのポイントを手動でラベル付けした「はい」または「いいえ」の2値スコアと比較しました。予測値はDLCで特定された値として、実際の値は人間が手動で採点したものとして定量化しました。次に、これを手動でスコアリングしたデータと比較して、手動でスコアリングされた squint の yes または no に対して squint が正しく識別された頻度を確認しました。略語:DLC = DeepLabCut;CGRP = カルシトニン遺伝子関連ペプチド;PBS = リン酸緩衝生理食塩水;TP = 真陽性;FP = 誤検出;FN = 偽陰性。TN = 真陰性;PPV = 正の適中率;NPV = 負の予測値;TPR = 真陽性率;TNR = 真陰性率MCC = マシューの相関係数。 この図の拡大版を表示するには、ここをクリックしてください。

図5:斜視を検出するための3つの異なるモデルにわたる斜視表現型。 上の 2 行には、斜視を検出するための 3 つの異なるモデルで、各条件 (PBS または CGRP) を持つ同じ代表的な動物が含まれています。一番下の行は、すべての動物の平均を反映しています。(A)CGRP処理マウスとPBS処理マウス(t(18)= 2.805、p = 0.012)では、以前に公開および検証された領域スクイントモデル14を使用してすべてのデータを処理した後、平均ピクセル面積(平均全体のピクセル面積/ベースライン)が減少しました。(B) 手動でスコアリングしたデータでも同様の応答が見られた (t(18) = 4.064, p = 0.0007)。(C)CGRP処理マウスは、DLCを全データ処理に利用した場合、PBS処理マウス(t(18)=3.040、p=0.007)に比べて、平均眼瞼間距離(治療ユークリッド距離/治療前ユークリッド距離、ベースライン)が減少した。N = 20(女性10人、男性10人)。エラーバーは平均±SEMを示します。 この図の拡大版を表示するには、ここをクリックしてください。
このプロトコルは、機械学習ベースのツールを使用して、以前のアプローチと同じ(またはそれ以上の)時間分解能を維持しながら、人間に近い精度で斜視を区別できる、簡単にアクセスできる詳細な方法を提供します。主に、自動斜視の評価をより多くのユーザーがより簡単に利用できるようにします。自動斜視の評価方法としては、従来のモデルに比べていくつかの改良が加えられています。まず、斜視の定量化に実際に関与するポイントが少なくなるため、ASM よりも堅牢なメトリクスを提供します。これにより、斜視を示す値を生成するときに分析が依存する点が少なくなるため、誤検出と偽陰性の可能性が減少します。言い換えれば、DLCモデルでは、目の周りの各点は必要になりますが、時間点を含めるには十分ではありません。これにより、ASM と同じ数のポイントを使用して最適でないデータをフィルタリングでき、非常に多くの構成ポイントに依存することによる大きな変動性に頼る必要がなくなります。さらに、訓練された個人の精度に完全に依存しないモデルを設計することで、潜在的なヒューマンエラーを減らしました。
データを処理する際、私たちの方法は、マウスの目の最大サイズを考慮して、可能なものよりも大きい最適でないポイントと外れ値のポイントを正確にフィルタリングすることがわかりました(プロトコルセクション10)。目を囲む 10 個の点のそれぞれが 0.92 より大きい尤度値を持っているかどうかを確認し、その値より小さいものをフィルタリングするマクロを利用しました。将来的には、これを調整して、処理されたデータを多かれ少なかれ選択的にすることができます。また、マクロでは、200 ピクセルを超えるユークリッド距離の値もフィルタリングされ、目の上端と下面の間の最大距離は 150 ピクセルであることがわかりました。これは、実験のセットアップによっては変更が必要な場合があります。カメラが目から同じ距離にない場合、最大値は大幅に増減する可能性があります。これらのマクロの強みは、目を囲むすべての構成要素について高い可能性を報告するモデルに依存する方法で、目の上部と下部の間の測定値を抽出できたことです。
DLCとASMはどちらも、マウスがカメラから所定の距離の固定位置にあることに依存して、ベースラインと治療条件の間で一貫した倍率スケーリングを可能にするという点で制限があります。したがって、動物自体からの動き、装置内の誤った位置、または実験手順の変更は、モデルが眼の全領域を検出する能力を損なうことになります。私たちのモデルは、ユークリッド距離、つまり目の長さの上下距離を利用することで、これらの制限をいくらか改善し、カメラの角度、動物からの動き、および異なるセッション間での実験の変動の違いにもかかわらず、追加の再キャリブレーションを必要とせずに追跡を改善できます。しかし、頭の動きを考慮した正規化の改善により、動いている動物の斜視の追跡がさらに向上する可能性があることを認識しています。
この方法のもう一つの制限は、ユークリッド距離がゼロに近づく点をフィルタリングし、目の閉じ方を示すことです。これらの顕著なスクイントの要因をフィルタリングしたにもかかわらず、CGRP によるスクイント応答を以前の方法よりも堅牢に検出することができました (p = 0.007)。この斜視の要素を取り除くことは、脳活動などの追加の関心のあるポイントと比較しようとすると、特に制限されます。これらの点を取り除きながら意味を見出すことは、この方法の堅牢性を示していると考えていますが、これらの斜視の要素を取り除くことは理想的ではないことを認識しています。この手法を利用する今後の研究では、ゼロに近づくにつれて斜視を認識するモデルをより適切に訓練するために、より多くの外れ値フレームを含める必要があります。全体として、自動斜視を確実に追跡する方法の開発により、自然に発生する行動の重要な特徴をその脳の状態に関連付けることを目的とした研究が可能になり、片頭痛などの脳活動プロファイルの堅牢な調査が可能になります。
開示すべき利益相反はありません。このペーパーの見解は、退役軍人省または米国政府を代表するものではありません。
洞察に満ちた会話をしてくれたRajyashree Senに感謝します。McKnight Foundation Neurobiology of Disease Award (RH)、NIH 1DP2MH126377-01 (RH)、Roy J. Carver Charitable Trust (RH)、NINDS T32NS007124 (MJ)、Ramon D. Buckley Graduate Student Award (MJ)、VA-ORD (RR&D) MERIT 1 I01 RX003523-0 (LS) に感謝します。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| CUDA toolkit 11.8 | |||
| cuDNN SDK 8.6.0 | |||
| Intel コンピューター Windows 11、第 13 世代 | |||
| LabFaceX 2D Eyelid Tracker Free Roaming Mouse用アドオンモジュール: | FaceX LLC | NA | 動物の目を記録できるカメラなら何でも十分ですが、これが当社のアイトラッキングハードウェアです。 |
| バージョン 450.80.02 以降の | |||
| NVIDIA RTX A5500、24 GB DDR6 | NVIDIA | [490-BHXV] | DLC のバージョンに指定されている最小要件 (現在は 8 GB) を満たす GPU で十分です。NVIDIA GeForce RTX 3080 Ti GPU |
| Python 3.9-3.11 | |||
| TensorFlowバージョン2.10 |
Request permission to reuse the text or figures of this JoVE article
Request Permission