Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Neuroscience

Operante protocolos para evaluar el análisis de costo-beneficio en decisiones reforzadas por roedores

Published: September 10, 2018 doi: 10.3791/57907
* These authors contributed equally

Summary

Un análisis de costo-beneficio es un enfoque de balanza que el cerebro lleva a cabo durante el curso de la toma de decisiones. Aquí, proponemos un protocolo para entrenar a las ratas en un paradigma de toma de decisiones basado en la operante en ratas elegir recompensas más altas a costa de esperar 15 s para recibirlos.

Abstract

Guiada por el refuerzo de la toma de decisiones es la capacidad de elegir entre cursos de competencia de acción basada en el valor relativo de los beneficios y sus consecuencias. Este proceso es parte integral de la conducta humana normal y se ha demostrado para ser interrumpidas por trastornos neurológicos y psiquiátricos tales como depresión, esquizofrenia y adicción. Roedores han sido utilizados para descubrir la neurobiología de la cognición humana. Para ello, se han desarrollado varias tareas conductuales; sin embargo, la mayoría es no automatizados y mano de obra intensiva. El reciente desarrollo del microcontrolador open source ha permitido a los investigadores automatizar las tareas basado en la operante para evaluar una variedad de tareas cognitivas, estandarizar la presentación de estímulos, mejorar la grabación de datos y por lo tanto, mejorar los resultados de la investigación. Aquí, describimos automatizada basado en la demora guiada por el refuerzo de toma de decisiones tarea, usando un operante T-laberinto controlada por programas de software de medida. Mediante estas tareas de toma de decisiones, mostramos los cambios en las actividades potenciales de campo local en la corteza cingulada anterior de una rata mientras realiza una tarea de toma de decisiones y costo-beneficio basado en la demora.

Introduction

Toma de decisiones es el proceso de reconocer y seleccionar decisiones basadas en los valores y preferencias de las decisiones y las consecuencias de la acción seleccionada1. Aunque la toma de decisiones ha sido extensamente estudiada en diferentes campos (es decir, economía, psicología y neurociencia), mecanismos neuronales subyacentes a tales capacidades cognitivas no se entienden todavía completamente. Dos subcategorías de toma de decisiones son decisiones perceptuales y guiada por el refuerzo de la toma de decisiones. Aunque incorporan conceptos y elementos de superposición considerable, perceptivo de la toma de decisiones se basa en la información sensorial disponible1,2, considerando que la toma de decisiones guiada por refuerzo aborda el valor relativo de acciones durante un plazo específico3. Un aspecto importante del armado de la toma de decisiones es el análisis de costo-beneficio que se realiza de forma intuitiva por el cerebro calculando los beneficios de las opciones dadas y restando los costes de cada alternativa1.

El T-laberinto (o la variante laberinto) es uno de los laberintos más utilizado en experimentos cognitivos con roedores. Animales se colocan en el brazo de arranque (la base de la T) y permite elegir el brazo de objetivo (uno de los brazos laterales). Tareas como una alternancia forzada o discriminación izquierda y derecha se utilizan principalmente con los roedores en la T-laberinto a la prueba de referencia y trabajo memoria4. T-laberintos son también ampliamente utilizados en experimentos de toma de decisiones5,6,7. En el diseño más simple, la recompensa se coloca en el brazo de un único objetivo. La elección es predecible, y animales sin duda prefiere la recompensa más que nada, independientemente del valor de la recompensa. Otra opción es colocar recompensas en ambos brazos del objetivo y dejar que los animales tomar una decisión de qué camino tomar dependiendo de varios parámetros (es decir, la preferencia natural de los animales, la diferencia en el valor de las recompensas y los costos a pagar). En el diseño basado en el valor, la tarea se complica más por tener propiedades de escala de pesaje. De esta manera, un animal recibe recompensas diferentemente valorados por elegir entre dos alternativas, así como los costos de las acciones [es decir, la cantidad de espera (delay-basado) o la cantidad de esfuerzo (esfuerzo-basado) necesario para recibir recompensas], cada uno contribuye a la decisión que se hace de5,6.

Tradicional basada en el retraso T-laberinto toma de decisiones, los animales están capacitados para seleccionar el brazo de la recompensa alta (HRA) y evitar lo contrario brazo baja recompensa (del Señor LRA). Los lados de la HRA y el LRA permanecen sin cambios durante todo el experimento. Aunque la tarea descrita anteriormente ha sido bien documentada en la literatura, sufre de varios inconvenientes procesales. En primer lugar, por tener un brazo de objetivo fijo, el animal sabe que el brazo para elegir desde el comienzo de cada ensayo. En este escenario, los animales pueden seleccionar el brazo objetivo basado en su memoria y no en la toma de decisiones. Por lo tanto, en un paradigma de toma de decisiones basado en la demora, si un animal selecciona la recompensa baja debido a la intervención del estudio, no será claro si esto es debido a una pérdida de memoria o a la intervención del estudio. Puede ser considerada como un grupo de control de memoria para segregar el comportamiento observado por el problema de memoria, pero esto afecta investigadores y animales por igual debido a los trabajos adicionales7. Una segunda preocupación es el momento de la toma de decisiones por el animal: una vez los animales a la zona de decisión (la Unión de los tres brazos), suelen mirar a la izquierda y a la derecha, pesan los costos y beneficios con respecto a cada brazo y entonces tomar su decisión. Sin embargo, después de unos pocos ensayos, realizan tal cómputo antes de llegar a la zona de decisión y ejecuta directamente en el brazo de recompensa. Como resultado, estos dos inconvenientes — un sesgo previo a uno de los brazos y encontrar el momento de la toma de decisiones, ambos altamente interrumpen la interpretación del electrofisiológicos y los datos de neuroimagen.

En el método explicado en este artículo, el brazo preferido (HRA) se localiza por una señal auditiva y puede variar de ensayo a ensayo. Animales inician los ensayos al entrar en la zona de prueba (figura 1) y dispara la señal auditiva pinchándola"nariz-" una puerta infrarrojos que se ha colocado en el cruce de los tres brazos. La señal de audio (20 dB, entre 500 y 1.000 ms) se juega desde un altavoz en el extremo del brazo de meta.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Todos los procedimientos explicaron aquí fueron aprobados y realizados conforme a la guía para el cuidado y uso de animales de laboratorio y fueron aprobados por el Comité de ética Animal Florey Institute o el centro de investigación de Neurociencia.

1. vivienda, manejo y restricción de alimentos

  1. Utilizar ratas macho adulto (normalmente de 8 semanas de edad) (cualquier cepas) y mantenerlos en la habitación con un ciclo de 12 h luz/oscuridad.
  2. Restringir su acceso a los alimentos para alentar a los animales para realizar la tarea.
    Nota: Los animales de la vivienda singular sugiere, ya que proporciona un mejor control de la ingestión de alimentos de cada uno.
  3. En los días 1-3, manejar los animales por aproximadamente 5 min, 2 x al día.
    Nota: Manejo familiariza a los animales con contacto humano y disminuye el nivel de estrés y la ansiedad en los animales durante los experimentos.
  4. Pesar los animales después de cada sesión de tratamiento. Uso de peso el primer día como la cantidad de libre-alimentación y mantener los animales en aproximadamente 80-85% de su importe de libre-alimentación.

2. Montaje experimental

  1. Utilice un T-laberinto equipado con 3 particiones o brazos, 2 altavoces de estímulo, 5 puertas retráctiles y 5 sensores de movimiento infrarrojos o sensores de rayos infrarrojos (IRB).
    Nota: Se puede construir el T-laberinto de fibra de densidad media (MDF) o cloruro de polivinilo (PVC).
  2. Control del laberinto construido aquí por un microcontrolador Arduino.
  3. Copie el código de Arduino en el ordenador.
  4. Descargar el software de Arduino desde la Web de software e instalarlo en un ordenador.
  5. Conectar el microcontrolador al ordenador mediante un puerto USB.
  6. En el equipo, haga clic en el icono del software, vaya a herramientasy luego seleccione Puerto.
  7. En el menú desplegable, seleccione el puerto COM (puerto de comunicaciones) que conecta el software a la computadora.
  8. Ir a herramientas y seleccionar tablas. En el menú desplegable, seleccione el tipo de Arduino que controla la T-laberinto.
  9. Haga clic en cargar en la parte superior izquierda de la ventana de la interfaz. Seleccione el código de Arduino. Espere hasta que termine el proceso.
  10. Haga clic en el monitor Serial en la parte superior derecha de la ventana de la interfaz. Entonces, en una nueva ventana pop-out, cambiar la velocidad en baudios a 115200.

3. habituación al laberinto

  1. Antes de cada período de sesiones de habituación, llevar los animales a la sala de experimento por lo menos 1 h antes del experimento.
  2. 10 bolitas de azúcar de dejar en cada brazo de la meta y dejar todas las puertas abiertas.
    Nota: En esta etapa, no hay para seguir los movimientos de los animales (figura 1).
  3. Días 1-3: Coloque los animales individualmente en el laberinto durante períodos de 10 min, 1 x al día, para explorar el laberinto sin restricciones.
  4. Días 4-5: Coloque los animales individualmente en el laberinto. Dejar 2 pastillas en cada brazo y les permiten probar la comida de ambos lados. Quitar el animal del laberinto inmediatamente después de comer pellets de ambos lados o después de 5 minutos de estar en el laberinto.
    Nota: La principal diferencia entre esta etapa y la etapa anterior es que los animales necesitan extraerse el laberinto inmediatamente después de comer pellets de ambos lados. Esto familiarizar a un animal con ser quitado del laberinto en el final de un juicio.
  5. Después de cada sesión, limpiar pisos de laberinto con etanol al 70% y asegúrese de que el etanol se evapore antes de colocar el siguiente animal en el laberinto.

4. discriminación formación

  1. Preparación de laberinto
    1. Día 6: Llevar los animales a la sala de experimento por lo menos 1 h antes del experimento.
    2. Ejecute el programa de Arduino y establece el número del ensayo en 14 de los cuales los 4 primeros ensayos será selección forzada y el resto serán ensayos de elección.
      Nota: El programa generará aleatoriamente igual número de ensayos que se asignará a la izquierda y derecha de la T-laberinto.
    3. Antes de cada ensayo, colocar 4 bolitas en el brazo de la meta que se localiza la HRA y 2 pastillas en el otro brazo que es la LRA.
  2. Formación prueba de selección forzada (4 ensayos)
    1. Pseudo-al azar bloque un brazo antes de cada ensayo para que el animal se ve obligado a seleccionar el otro brazo.
      Nota: El brazo bloqueado puede ser un brazo de alta recompensa o un brazo de recompensa baja mientras que la señal auditiva destaca el lado de la HRA.
    2. Colocar un animal en la caja de inicio (figura 1). Después de s 5-7, al mismo tiempo abrir la puerta de salida y haga clic en iniciar en la ventana de la interfaz de Arduino.
    3. Recoger el animal inmediatamente después de comer pellets o después de 5 minutos de estar en el laberinto.
    4. Dejar el animal en la jaula casera por 2 min.
  3. Opción capacitación prueba (10 ensayos)
    1. Antes de cada ensayo, cerca de la puerta B en el brazo que es seleccionado por el software que la HRA. Deja A puerta abierta en el brazo opuesto (LRA).
    2. Colocar un animal en la caja de inicio (figura 1). Después de s 5-7, al mismo tiempo abrir la puerta de salida y haga clic en Inicio.
    3. Deje que el animal elegir libremente cualquiera de los dos brazos. Si el animal elige la HRA, puerta abierta-A, deje que el animal ingrese a la cámara, cierre la puerta-A y puerta abierta-B inmediatamente para dar el acceso de animales a los alimentos seleccionados bien.
    4. Si el animal elige el ERS, puerta B para dar el acceso de animales a la comida bien.
    5. Retire al animal después de que se ha comido toda la comida en la comida seleccionada bien y dejarlo en la jaula casera por 2 min.
    6. Completar los 10 ensayos de elección para cada animal y registrar la elección del animal (HRA o LRA) en cada ensayo.
    7. Calcular el porcentaje de preferencia alta recompensa (HRC) para los ensayos de elección después de cada sesión de entrenamiento.
    8. Tras la realización de 14 senderos, los tiempos individuales obtenidos por cada sensor infrarrojo se muestran en la ventana de interfaz de Arduino.

5. retardo de formación

  1. Una vez cada animal ha alcanzado el 80% de HRC en el entrenamiento de discriminación (paso 4), empezar la formación demora ejecutando 10 ensayos por día para cada animal. En esta etapa, puerta B debe ser abierto después de sólo 5 s de demora cuando el animal elige la HRA.
  2. Si el animal alcanza un HRC de 80% al final de una sesión de entrenamiento con un retraso de s 5, aumente el retraso a 10 s para la siguiente sesión de entrenamiento.
  3. Una vez que el animal ha alcanzado un HRC de 80% con un retraso de s 10, aumente el retraso a 15 s para la siguiente sesión de entrenamiento.
  4. Grabar la elección del animal para cada ensayo calcular el HRC después de cada sesión de entrenamiento.
  5. Tras la realización de los ensayos, los tiempos individuales obtenidos por cada sensor infrarrojo se muestran en la ventana de interfaz de Arduino.
    Nota 1: El temporizador se inicia al hacer clic en Enter. El 'Time_decision' es el tiempo después de la nariz-poke a la IRB-1. 'Time_left_1' es el momento en que un animal rompe IRB - 1L y 'Time_left_2' cuando CRI - 2L está quebrado. Si el estudio de comportamiento se combina con imágenes neuronales o electrofisiología (p. ej., proyección de imagen de calcio), métodos de grabación de película se recomienda para una mejor sincronización del comportamiento del animal a las señales neuronales.

6. electrofisiología (fabricación de electrodos)

  1. Utilice electrodos bipolares o solo para registrar los potenciales de campo local (LFPs).
    Nota: Se sugiere el uso de electrodos bipolares porque le permite volver a referencia local reducir el impacto de la conducción de volumen. Por lo tanto, la LFP grabada es el voltaje diferencial entre 2 electrodos a una distancia de ~ 200 μm entre las puntas.
  2. Para hacer un electrodo bipolar, unir 2 electrodos de tungsteno o viento juntos 2 cables de acero inoxidable (normalmente, se utilizan cables de acero inoxidable recubierto de PFA con un diámetro de 50 μm).
  3. La puesta a tierra de la soldadura y grabación alambres a un enchufe mini para convertirse en un conector para el sistema de grabación de electrofisiología.

7. anestesia

  1. Para implantar los electrodos, anestesiar las ratas por una inyección intraperitoneal de una mezcla de ketamina (100 mg/kg) y xilacina (8 mg/kg), o mediante la administración de isoflurano como se describe en los pasos siguientes.
    Nota: Isoflurano se recomienda debido a la mejora del control de la profundidad anestésica.
  2. Use una máquina de anestesia con oxígeno controlado y flujo de vapor anestésico.
  3. Para anestesiar el animal por isoflurano, colocar en la cámara de inducción e isoflurano a una tasa de alrededor del 4% y oxígeno en 500-1.000 mL/min en la máquina anestésica.
  4. Continúa la inducción hasta que desaparezca el reflejo adrizante del animal.
  5. Establecer la tasa de mantenimiento anestésico en 1-2.5% isoflurano y 300-400 mL/min de oxígeno en la máquina.
  6. Coloque una almohadilla de calor con aislamiento (algodón) en un dispositivo estereotáxicas y luego inmovilizar el animal en el dispositivo estereotáxicas.
  7. Medir el nivel de anestesia por pellizcarse los dedos del pie del animal.

8. quirúrgico

  1. Usando una máquina de afeitar eléctrica o un par de tijeras, afeitar la cabeza del animal donde la incisión debe ser hecha.
  2. Frote el área quirúrgica con etanol y luego con povidona-yodo, 4%.
  3. Aplique lubricante ocular para proteger la córnea del animal durante la cirugía.
  4. Utilizando tejido pinzas, tire suavemente de la piel entre los ojos y oídos del animal. Con unas tijeras, cortar la piel que está pellizcada entre las pinzas y quite el periostio.
  5. Utilice peróxido de hidrógeno para limpiar y desinfectar el cráneo.
  6. Encontrar la ubicación del punto de inserción del electrodo usando coordenadas estereotáxicas y marque en el cráneo con un marcador permanente.
  7. Use un taladro de mano para hacer un agujero para el electrodo de puesta a tierra, uno para anclar el implante y un agujero por el electrodo de la grabación.
  8. Inserte los electrodos en una velocidad muy lenta para minimizar el posible daño cortical y subcortical.
  9. Conectar el electrodo de puesta a tierra en el cráneo usando un pequeño tornillo.
  10. Fije el enchufe conector en su lugar con una fina capa de cemento acrílico dental.
  11. Inyectar la buprenorfina (15 μg/kg, por vía subcutánea) o meloxicam (1-3 mg/kg, por vía subcutánea) como un analgésico.
  12. Dejar el animal en una jaula sobre una estera caliente para recuperarse. Observar al animal por lo menos cada 30 minutos hasta que haya recuperado de la anestesia.

9. después del procedimiento formación

  1. Después de la cirugía, permiten al menos un período de 10 días de recuperación. Casa los animales individualmente con libre acceso al alimento y agua ad libitum y supervisar sobre una base diaria (véase Rudebeck, Walton, Smyth, Bannerman y Rushworth7 para obtener más información).
  2. Después de la recuperación, empezar a restringir la dieta del animal hasta el 85% de su importe de libre-alimentación.
  3. Reciclar a los animales en el laberinto para recordar la fase de discriminación (paso 4).
  4. Continuar formación los ratones hasta que hayan alcanzado el 80% de HRC.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Los datos presentados aquí están la LFP grabada desde la corteza orbitofrontal izquierda (OFC) y la corteza cingulada anterior (ACC) de seis ratas Wistar macho con electrodos bipolares (de acero inoxidable recubierto de PFA). La tabla 1 muestra la longitud de la adquisición de comportamiento para cada etapa de formación. Las coordenadas de los lugares de destino se determinaron a partir de una rata cerebro atlas9 y son las siguientes: para la AAC, 1,2 mm anterior bregma, 0,8 mm lateral a la línea media y ventral al cráneo; 2 mm y para el OFC, 3,5 mm anterior el bregma, 2,3 mm lateral a la línea media y ventral al cráneo 5,4 mm.

Las grabaciones fueron filtrado pasabanda (0.01 - 250 Hz) para extraer LFPs y luego muestrearon a 1000 Hz. El análisis espectral fue realizado en LFPs utilizando la forma cónica múltiple10. Cinco cirios de Slepian y un producto de ancho de banda de tiempo de tres se utilizaron para lograr la óptima concentración espectral. Tiempo frecuencia espectrogramas se estimaron utilizando una-ventana corredera de 300 ms que fue cambiado de puesto sobre los datos en pasos de 5 ms. Para una mejor observación de la modulación de la tarea dependiente de las potencias espectrales y para atenuar el problema de energía de escala 1/f, espectrogramas todos fueron base normalizada y se convierte en decibelios usando dBtf = 10log10 (Stfacercaf), donde Stf es el espectro en el tiempo t y la frecuencia f y mSf es la gama media de todos los puntos de tiempo en la línea de fondo dentro de una banda de frecuencia11. Los poderes espectrales se calcularon para la línea base (300 ms antes de meter por la nariz), estímulo (100 ms), precámara (300 ms antes de entrar en la cámara) y acristalamiento (ms 600) tiempo. El análisis estadístico se realizó mediante una base de permutación no paramétrica t-test.

Como se muestra en la fila superior de la figura 2A, hubo una disminución en las bajas (4-12 Hz) y alta (45-85 Hz) energías de frecuencia en el ACC desde el inicio hasta el final del estímulo. Comparando el tiempo pasado fuera de la cámara con el tiempo en la cámara, el análisis espectral no mostró cambios en las actividades oscilatorias (como se ve en la fila superior de la figura 2B) en el ACC.

Oscilaciones de baja frecuencia en la OFC también mostraron disminuciones en el poder espectral mientras que los animales se acercó a la puerta de IR; sin embargo, esto apareció anteriores (-80 ms) y duró más tiempo en comparación con las oscilaciones de baja frecuencia en el ACC (50-420ms). Actividades (23-100 Hz) de la banda de frecuencias medias/altas en la OFC aumentaron después de la aparición del estímulo (figura 2A, fila inferior). No se observaron cambios significativos en las ventanas de tiempo de cámara anterior y cámara cuando estaban comparados juntos (figura 2B, fila inferior). Estos resultados están en consonancia con los resultados anteriores suponiendo que el OFC y ACC están involucrados en la toma de decisión basado en el valor2,12,13.

Figure 1
Figura 1: esquema de una elección en una tarea de toma de decisiones basada en el retraso de. El laberinto medidas 60 cm x 10 cm x 40 cm. La caja de inicio está conectada al brazo de arranque a través de una puerta retráctil. Dos otras puertas retráctiles (puerta-A y puerta-B) se colocan en cada brazo de objetivo y juntos hacen una cámara para demorar el acceso de los animales a las recompensas. Puerta-A se coloca 12,5 cm desde el punto de entrada a cada brazo y puerta-B se coloca justo antes de la comida bien, 5 cm desde el extremo del brazo. Un alimento metal levantado bien, 3 cm de diámetro, se coloca en el extremo de cada brazo de la meta, 2 cm por encima del piso del laberinto.

El animal se coloca en el cuadro de inicio y se le permite acercarse y nariz-poke la puerta infrarroja (IRB-1) para activar el estímulo auditivo que la HRA de señales (en este panel, el brazo derecho). La fecha y hora IRB - 2L y 2R IRB elección del animal. Si el animal da vuelta derecha, A la puerta se abre para permitir que el animal Introduzca el brazo (cámara) y se cierra inmediatamente después de que el animal entra en. Después de 15 s, B la puerta se abre para dar el acceso de animales a la recompensa. Si el animal decide girar a la izquierda, (A la puerta se abre en el lado izquierdo), B de la puerta se abre inmediatamente después entra en el compartimiento izquierdo. La fecha y hora IRB - 3L y 3R IRB entrada del animal a la cámara.

Figure 2
Figura 2: dinámica Temporal y espectral de las actividades neuronales ACC y OFC. (A) este panel muestra tiempo-frecuencia parcelas de ACC (fila superior) y actividades neuronales OFC (fila inferior) en una acertada discriminación alta recompensa. Los poderes espectrales son normalizado base restando la ventana posterior sobresaliendo desde la ventana de tiempo de línea de base. El valor 0 en la abscisa denota la aparición del estímulo auditivo. (B) este panel muestra diagramas de tiempo-frecuencia del CAC (fila superior) y OFC (fila inferior) actividades neuronales cuando el animal entra en la cámara. La ventana de tiempo de cámara se normaliza por la ventana de tiempo de la cámara. El valor 0 en la abscisa denota el momento de apertura de puerta-A. Las bolsas de color representan la magnitud de los cambios espectrales en escala de decibelios. Los rectángulos negros demuestran desviaciones significativas del nivel de probabilidad (p < 0.05 por dos-prueba de permutación de cara). Haga clic aquí para ver una versión más grande de esta figura.

Habituación Entrenamiento de la discriminación Formación de retardo (5s) Formación de retardo (10s) Formación de retraso (15) total
Rata 1 3 días 15 días 8 días 6 días 5 días 37 días
Rata 2 3 días 18 días 9 días 6 días 5 días 41 días
Rata 3 3 días 13 días 7 días 5 días 6 días 34 días
Rata 4 3 días 15 días 9 días 6 días 6 días 39 días
Rata de 5 3 días 17 días 8 días 7 días 5 días 40 días
Rata 6 3 días 16 días 7 días 6 días 6 días 38 días

Tabla 1: Variabilidad conductual y el curso del tiempo de aprendizaje de 6 ratas.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Roedores han sido utilizados en estudios neurocientíficos que tratan diferentes temas, desde las habilidades cognitivas como el aprendizaje y la memoria2,14 y comportamiento reforzado7,15,16 para el control central de órganos17,18 y Neurofarmacología19,20. El protocolo propuesto explica una tarea compleja de comportamiento adecuada para experimentos con Electrofisiología y de neuroimagen. Hemos descrito la tarea guiada reforzada basado en la demora para las ratas, pero puede ser adaptado para los ratones desde ratas y ratones realizan asimismo tareas de tierra seca.

Utilizamos asomando por la nariz como el estímulo para desencadenar un estímulo audio. Sin embargo, presionar la palanca y otras modalidades de estímulo tales como estímulos olfativos o visuales también pueden ser utilizados individualmente o simultáneamente. La tarea propuesta operante tiene un número de beneficios y ventajas sobre los métodos existentes no operante. Más convincente es la automática timestamping exacto del curso de las decisiones de los animales que, de otra manera, es muy difícil. El método está especialmente bien adaptado a los estudios de electrofisiología y de neuroimagen. Otra ventaja es eliminar los componentes espaciales de la tarea que requieren grupos de control de memoria espacial. Como una tarea muy exigente, es muy probable que no todas las ratas realizan bien en el paradigma. Vuelva a colocar el animal si permanece inactivo en el brazo de inicio, entrar en la zona de decisión para más de 5 minutos de retrasos o produce mayor error tarifas comparar a otros animales en el grupo.

En cualquier momento de decisión, los costos y valores de cualquier opción se supone que ser evaluadas simultáneamente. Por lo tanto, elegir HRA o ERS en esta tarea puede ser resultado de cambios en la codificación de los costos, en la codificación de los beneficios, o en el cálculo de costo-beneficio. Una advertencia del método propuesto es ser incapaz de discriminar entre los procesos de codificación.

Hay una serie de pasos que puede tomar para maximizar el éxito en el entrenamiento de los animales y sus señales electrofisiológicas de grabación. En primer lugar, el manejo de los animales antes del entrenamiento es crucial. Como las sesiones de grabación comienzan con conectar los cables de la grabación a etapa los animales, tratar de los aclimatar a que le permiten sostener su cabeza. Esto es muy importante, y con frecuencia manejan animales ansiosos a ser durante este procedimiento puede dañar la etapa de la cabeza o el cable de grabación. En general, animales bien manejados son menos estresado, más fáciles de trabajar con y tienden a producir menos variables datos.

En segundo lugar, roedores dejan una variedad de señales de odorante en el laberinto (es decir, que contiene la feromona orina y heces, secretan las feromonas de su región de la barba y en los fluidos de sus almohadillas de pie). Por lo tanto, el laberinto tiene que limpiarse después de cada uso individual y en la conclusión de un experimento para minimizar el impacto de estas moléculas de olor residual en los resultados de la prueba. Etanol (70%) es un desinfectante común utilizado para limpiar equipo de prueba. Sin embargo, como muchos desinfectantes, alcohol sí mismo tiene un olor que puede influir el comportamiento de roedor. Por lo tanto, asegúrese de que ha evaporado completamente antes de colocar un animal en el laberinto.

En tercer lugar, aunque son menos sensibles al ruido que picos LFPs, utilizando conectores sólidos y un cable bien asegurado disminuye el nivel de ruido de movimiento. Rociando ligeramente con agua en el piso del laberinto puede disminuir la electricidad estática que se crea por la fricción entre la piel del animal y la superficie del piso.

En conclusión, el protocolo descrito en este artículo puede ayudar a diseñar experimentos de toma de decisiones reforzados base de retardo y registrar señales electrofisiológicas mientras el animal está realizando la tarea.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

Esta investigación fue apoyada por la Fundación de Neurociencias de RMH, Australia; la Fundación australiana del cerebro; la RACP Thyne Reid beca, Australia; y por un proyecto del Consejo de tecnologías, Irán a Abbas Haghparast y ciencias cognitivas.

Materials

Name Company Catalog Number Comments
T-maze Self made
Dustless Precision Sugar Pellets TSE Systems Intl. Group F0023 45 mg, Sucrose
Ketamine Hydrochloride Injection, USP Sigma-Aldrich 6740-87-0
Xylazine Sigma-Aldrich 7361-61-7
stereotaxic device Stoelting
Isofluran Santa Cruz Biotechnology sc-363629Rx
PFA-coated stainless-steel wires A-M systems
acrylic cement Vertex, MA, USA
(wooden or PVC (polyvinyl chloride)-made) local suppliers
Mini-Fit Power Connector Molex 15243048
ethannol 70% Local suppliers
buprenorphine diamondback drugs
Arduino UNO Arduino https://www.arduino.cc/
Infrared emitting diode Sharp GL480E00000F http://www.sharp-world.com/
Chronux Toolbox Chronux.org
Arduino codes https://github.com/dechuans/arduino-maze

DOWNLOAD MATERIALS LIST

References

  1. Gold, J. I., Shadlen, M. N. The neural basis of decision making. Annual Review of Neuroscience. 30, 535-574 (2007).
  2. Shi, Z., Müller, H. J. Multisensory perception and action: development, decision-making, and neural mechanisms. Frontiers in Integrative Neuroscience. 7, 81 (2013).
  3. Sutton, R. S., Barto, A. G. Reinforcement Learning: An Introduction. 1, MIT Press. Cambridge, MA. (1998).
  4. Khani, A., Rainer, G. Neural and neurochemical basis of reinforcement-guided decision making. Journal of Neurophysiology. 116, 724-741 (2016).
  5. Fatahi, Z., Haghparast, A., Khani, A., Kermani, M. Functional connectivity between anterior cingulate cortex and orbitofrontal cortex during value-based decision making. Neurobiology of Learning and Memory. 147, 74-78 (2018).
  6. Khani, A., et al. Activation of cannabinoid system in anterior cingulate cortex and orbitofrontal cortex modulates cost-benefit decision making. Psychopharmacology. 232, 2097-2112 (2015).
  7. Rudebeck, P. H., Walton, M. E., Smyth, A. N., Bannerman, D. M., Rushworth, M. F. Separate neural pathways process different decision costs. Nature Neuroscience. 9, 1161-1168 (2006).
  8. Gage, G. J., et al. Surgical implantation of chronic neural electrodes for recording single unit activity and electrocorticographic signals. Journal of Visualized Experiments. (60), e3565 (2012).
  9. Paxinos, G., Watson, C. The Rat Brain in Stereotaxic Coordinates. , Academic Press. San Diego, CA. (1998).
  10. Bokil, H., Andrews, P., Kulkarni, J. E., Mehta, S., Mitra, P. P. Chronux: a platform for analyzing neural signals. Journal of Neuroscience Methods. 192, 146-151 (2010).
  11. Cohen, M. X. Analyzing Neural Time Series Data: Theory and Practice. , MIT Press. Cambridge, MA. (2014).
  12. Luk, C. -H., Wallis, J. D. Choice coding in frontal cortex during stimulus-guided or action-guided decision-making. Journal of Neuroscience. 33, 1864-1871 (2013).
  13. Rudebeck, P. H., et al. Frontal cortex subregions play distinct roles in choices between actions and stimuli. Journal of Neuroscience. 28, 13775-13785 (2008).
  14. Goshadrou, F., Kermani, M., Ronaghi, A., Sajjadi, S. The effect of ghrelin on MK-801 induced memory impairment in rats. Peptides. 44, 60-65 (2013).
  15. Haghparast, A., et al. Intrahippocampal administration of D2 but not D1 dopamine receptor antagonist suppresses the expression of conditioned place preference induced by morphine in the ventral tegmental area. Neuroscience Letters. 541, 138-143 (2013).
  16. Esmaeili, M. -H., Kermani, M., Parvishan, A., Haghparast, A. Role of D1/D2 dopamine receptors in the CA1 region of the rat hippocampus in the rewarding effects of morphine administered into the ventral tegmental area. Behavioural Brain Research. 231, 111-115 (2012).
  17. Chaleek, N., Kermani, M., Eliassi, A., Haghparast, A. Effects of orexin and glucose microinjected into the hypothalamic paraventricular nucleus on gastric acid secretion in conscious rats. Neurogastroenterology & Motility. 24, e94-e102 (2012).
  18. Kermani, M., Eliassi, A. Gastric acid secretion induced by paraventricular nucleus microinjection of orexin A is mediated through activation of neuropeptide Yergic system. Neuroscience. 226, 81-88 (2012).
  19. Kermani, M., Azizi, P., Haghparast, A. The role of nitric oxide in the effects of cumin (Cuminum Cyminum L.) fruit essential oil on the acquisition of morphine-induced conditioned place preference in adult male mice. Chinese Journal of Integrative Medicine. , 1-6 (2012).
  20. Ahmadi, A., et al. Synthesis and antinociceptive behaviors of new methyl and hydroxyl derivatives of phencyclidine. Current Medicinal Chemistry. 19, 763-769 (2012).

Tags

Neurociencia número 139 T-laberinto reforzado el comportamiento basado en el retraso de la toma de decisiones potenciales de campo local corteza cingulada anterior corteza orbitofrontal
Operante protocolos para evaluar el análisis de costo-beneficio en decisiones reforzadas por roedores
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Kermani, M., Fatahi, Z., Sun, D.,More

Kermani, M., Fatahi, Z., Sun, D., Haghparast, A., French, C. Operant Protocols for Assessing the Cost-benefit Analysis During Reinforced Decision Making by Rodents. J. Vis. Exp. (139), e57907, doi:10.3791/57907 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter