Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Environment

Procesamiento automático de imágenes para determinar la estructura del tamaño de la comunidad de macroinvertebrados ribereños

Published: January 13, 2023 doi: 10.3791/64320

Summary

El artículo se basa en la creación de un protocolo adaptado para escanear, detectar, clasificar e identificar objetos digitalizados correspondientes a macroinvertebrados bentónicos de río utilizando un procedimiento de imagen semiautomático. Este procedimiento permite la adquisición de las distribuciones de tamaño individuales y métricas de tamaño de una comunidad de macroinvertebrados en aproximadamente 1 h.

Abstract

El tamaño corporal es un rasgo funcional importante que puede utilizarse como bioindicador para evaluar los impactos de las perturbaciones en las comunidades naturales. La estructura del tamaño de la comunidad responde a gradientes bióticos y abióticos, incluidas las perturbaciones antropogénicas en taxones y ecosistemas. Sin embargo, la medición manual de organismos de cuerpo pequeño como los macroinvertebrados bentónicos (por ejemplo, >500 μm a unos pocos centímetros de largo) lleva mucho tiempo. Para acelerar la estimación de la estructura del tamaño de la comunidad, aquí, desarrollamos un protocolo para medir semiautomáticamente el tamaño corporal individual de los macroinvertebrados de río preservados, que son uno de los bioindicadores más utilizados para evaluar el estado ecológico de los ecosistemas de agua dulce. Este protocolo está adaptado de una metodología existente desarrollada para escanear mesozooplancton marino con un sistema de escaneo diseñado para muestras de agua. El protocolo consta de tres pasos principales: (1) escanear submuestras (fracciones de tamaño de muestra finas y gruesas) de macroinvertebrados de río y procesar las imágenes digitalizadas para individualizar cada objeto detectado en cada imagen; (2) crear, evaluar y validar un conjunto de aprendizaje a través de inteligencia artificial para separar semiautomáticamente las imágenes individuales de macroinvertebrados de los detritos y artefactos en las muestras escaneadas; y (3) que representa la estructura de tamaño de las comunidades de macroinvertebrados. Además del protocolo, este trabajo incluye los resultados de calibración y enumera varios desafíos y recomendaciones para adaptar el procedimiento a las muestras de macroinvertebrados y considerar mejoras adicionales. En general, los resultados apoyan el uso del sistema de escaneo presentado para la medición automática del tamaño corporal de los macroinvertebrados de río y sugieren que la representación de su espectro de tamaño es una herramienta valiosa para la bioevaluación rápida de los ecosistemas de agua dulce.

Introduction

Los macroinvertebrados bentónicos se utilizan ampliamente como bioindicadores para determinar el estado ecológico de las masas de agua1. La mayoría de los índices para describir comunidades de macroinvertebrados se centran en métricas taxonómicas. Sin embargo, se fomentan nuevas herramientas de bioevaluación que integren el tamaño corporal para proporcionar una perspectiva alternativa o complementaria a los enfoques taxonómicos 2,3.

El tamaño corporal se considera un metarasgo que está relacionado con otros rasgos vitales como el metabolismo, el crecimiento, la respiración y el movimiento4. Además, el tamaño corporal puede determinar la posición trófica y las interacciones5. La relación entre el tamaño corporal individual y la biomasa normalizada (o abundancia) por clase de tamaño en una comunidad se define como el espectro de tamaño6 y sigue el patrón general de una disminución lineal en la biomasa normalizada a medida que aumenta el tamaño individual en una escala logarítmica7. La pendiente de esta relación lineal ha sido ampliamente estudiada teóricamente, y estudios empíricos a través de ecosistemas la han utilizado como un indicador ecológico de la estructura del tamaño de la comunidad4. Otro indicador sintético de la estructura del tamaño de la comunidad que se ha utilizado con éxito en los estudios de funcionamiento de la diversidad de la diversidad del tamaño de la comunidad, que se representa como el índice de Shannon de las clases de tamaño del espectro de tamaño o su análogo, que se calcula sobre la base de las distribuciones de tamaño individuales8.

En los ecosistemas de agua dulce, la estructura de tamaño de diferentes grupos faunísticos se utiliza como indicador atáxico para evaluar la respuesta de las comunidades bióticas a gradientes ambientales 9,10,11 y a perturbaciones antropogénicas 12,13,14,15,16. Los macroinvertebrados no son una excepción, y su estructura de tamaño también responde a cambios ambientales17,18 y perturbaciones antropogénicas, como la minería 19, el uso de la tierra 20, o el enriquecimiento de nitrógeno (N) y fósforo (P) 20,21,22. Sin embargo, medir a cientos de individuos para describir la estructura del tamaño de la comunidad es una tarea tediosa y lenta que a menudo se evita como una medición de rutina en los laboratorios debido a la falta de tiempo. Así, se han desarrollado varios métodos de imagen semiautomáticos o automáticos para clasificar y medir especímenes23,24,25,26. Sin embargo, la mayoría de estos métodos se centran en la clasificación taxonómica más que en el tamaño individual de los organismos y no están listos para su uso para todo tipo de macroinvertebrados. En ecología del plancton marino, un sistema de análisis de imágenes de barrido se ha utilizado ampliamente para determinar el tamaño y la composición taxonómica de las comunidades de zooplancton 27,28,29,30,31. Este instrumento se puede encontrar en varios institutos marinos de todo el mundo, y se utiliza para escanear muestras de zooplancton preservadas para obtener imágenes digitales de alta resolución de toda la muestra. El presente protocolo adapta el uso de este instrumento para estimar el espectro del tamaño de la comunidad de macroinvertebrados en los ríos de manera rápida y automática sin invertir en la creación de un nuevo dispositivo.

El protocolo consiste en escanear una muestra y procesar toda la imagen para obtener automáticamente imágenes individuales (es decir, viñetas) de los objetos de la muestra. Varias medidas de forma, tamaño y características de nivel de gris caracterizan cada objeto y permiten la clasificación automática de los objetos en categorías, que luego son validadas por un experto. El tamaño individual de cada organismo se calcula utilizando el biovolumen elipsoidal (mm3), que se deriva del área del organismo medida en píxeles. Esto permite obtener el espectro de tamaño de la muestra de manera rápida. Hasta donde sabemos, este sistema de imágenes de escaneo solo se ha utilizado para procesar muestras de mesozooplancton, pero el dispositivo puede permitir trabajar con macroinvertebrados bentónicos de agua dulce.

El objetivo general de este estudio es, por lo tanto, introducir un método para obtener rápidamente el tamaño individual de los macroinvertebrados de río preservados mediante la adaptación de un protocolo existente previamente utilizado con mesozooplancton marino 27,32,33. El procedimiento consiste en utilizar un enfoque semiautomático que opera con un dispositivo de escaneo para escanear muestras de agua y tres software abierto para procesar las imágenes escaneadas. Aquí se presenta un protocolo adaptado para escanear, detectar e identificar macroinvertebrados de río digitalizados para adquirir automáticamente la estructura de tamaño de la comunidad y las métricas de tamaño relacionadas. La evaluación del procedimiento y las directrices para mejorar la eficiencia también se presentan a partir de 42 imágenes escaneadas de muestras de macroinvertebrados fluviales recogidas en tres cuencas del noreste (NE) de la Península Ibérica (Ter, Segre-Ebre y Besòs).

Las muestras se recogieron en tramos fluviales de 100 m siguiendo el protocolo de muestreo de campo y análisis de laboratorio de macroinvertebrados bentónicos de río en ríos vadeables del Gobierno español34. Las muestras se recolectaron con un muestreador surber (marco: 0,3 m x 0,3 m, malla: 250 μm) después de un estudio de múltiples hábitats. En el laboratorio, las muestras se limpiaron y tamizaron a través de una malla de 5 mm y una malla de 500 μm para obtener dos submuestras: una submuestra gruesa (malla de 5 mm) y una submuestra fina (malla de 500 μm), que se almacenaron en viales separados y se conservaron en etanol al 70%. Separar la muestra en dos fracciones de tamaño permite una mejor estimación de la estructura del tamaño de la comunidad, ya que los organismos grandes son más raros y menos que los organismos pequeños. De lo contrario, la muestra escaneada tiene una representación sesgada de la fracción de gran tamaño.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: El protocolo descrito aquí se basa en el sistema desarrollado por Gorsky et al.27 para el mesozooplancton marino. Una descripción específica de los pasos del escáner (ZooSCAN), el software de escaneo (VueScan 9x64 [9.5.09]), el software de procesamiento de imágenes (Zooprocess, ImageJ) y el software de identificación automática (Plankton Identifier) se puede encontrar en referencias anteriores32,33. Para ajustar mejor los tamaños de los macroinvertebrados bentónicos con respecto al mesozooplancton, una vez creado el proyecto siguiendo el protocolo original32,33, cambie el parámetro de tamaño mínimo (minsizeesd_mm) a 0,3 mm y el parámetro de tamaño máximo (maxsizeesd_mm) a 100 mm en el archivo de configuración. Para ayudar a seguir el protocolo, esto se resume en una tabla de trabajo (Figura 1). El proyecto creado se almacena en la carpeta C del equipo y se organiza en las siguientes carpetas: PID_process, Zooscan_back, Zooscan_check, Zooscan_config, Zooscan_meta, Zooscan_results y Zooscan_scan. Cada carpeta se compone de varias subcarpetas que las diferentes aplicaciones de software utilizan en los siguientes pasos del protocolo.

1. Adquisición de imágenes digitales para muestras de macroinvertebrados

  1. Escaneo y procesamiento del espacio en blanco
    NOTA: Cree dos imágenes en blanco diariamente antes de escanear para extraer los escaneos de fondo mientras procesa las imágenes escaneadas el mismo día.
    1. Encienda el escáner y encienda la luz en la posición dual para proyectar luz blanca desde la parte superior e inferior.
      NOTA: Al escanear muestras de mesozooplancton, se utiliza la dirección ascendente de la luz, pero debido a que los macroinvertebrados son más opacos, se recomienda cambiar la luz a una posición dual.
    2. Limpie y enjuague la bandeja de escaneo con agua del grifo.
    3. Vierta 110 ml de agua del grifo almacenada a temperatura ambiente (RT) en la bandeja de escaneo hasta que el vaso esté cubierto. Coloque el marco grande (24,5 cm x 15,8 cm) en la bandeja de escaneo en la posición correcta (con la esquina en la parte superior izquierda de la bandeja de escaneo) y llénelo con agua del grifo hasta que el escalón del marco esté cubierto para evitar un efecto de menisco, que alteraría la imagen escaneada. Cierre la tapa del escáner.
      NOTA: Use agua en RT para evitar la condensación y la formación de burbujas. Limpie el marco sin marcas ni gotas para evitar el reflejo de la luz.
    4. Vaya al software de procesamiento de imágenes, seleccione el proyecto de trabajo y haga clic en Escanear (Convertir) imagen de fondo.
    5. Vaya al software de escaneo y haga clic en Vista previa. Asegúrese de obtener una vista previa de la imagen escaneada, verifique que no haya líneas ni manchas y espere al menos 30 s antes de comenzar otro escaneo. Haga clic en Escanear y presione OK en la ventana de instrucciones antes del segundo escaneo para enviar los datos del software de escaneo al software de procesamiento de imágenes.
      NOTA: Escanee dos veces para obtener los dos escaneos de fondo que comprenderán el espacio en blanco. Este paso se realiza una vez al día antes de iniciar el procesamiento de muestras, y las imágenes se almacenan en la carpeta Zooscan_back.
    6. Cierre el software de escaneo después de finalizar el escaneo.
  2. Preparación y escaneo de muestras
    PRECAUCIÓN: El etanol es un líquido inflamable y podría causar daño / irritación ocular grave.
    1. Rellene los metadatos de ejemplo. Vaya al software de procesamiento de imágenes y seleccione Rellenar metadatos de muestra. Introduzca la identidad de la muestra, haga clic en Aceptar y rellene los metadatos.
      NOTA: El metarchivo se crea específicamente para muestras de mesozooplancton, por lo que no se ajusta a la metodología de muestreo de macroinvertebrados bentónicos, sin embargo, todos los campos del archivo deben completarse antes del escaneo, o aparecerá una bandera de error.
    2. Vierta 110 ml de etanol al 70% en la bandeja de escaneo hasta que el vidrio esté cubierto y coloque el marco grande (24.5 cm x 15.8 cm) con la esquina en la parte superior izquierda de la bandeja de escaneo.
      NOTA: Trabaje con etanol en lugar de agua, ya que los macroinvertebrados se conservan en etanol. En el agua, flotan y se desplazan en la bandeja de escaneo, evitando una imagen nítida y, por lo tanto, mediciones de tamaño confiables. El etanol debe conservarse en RT para evitar la condensación y la formación de burbujas.
    3. Vierta la muestra de macroinvertebrados en la bandeja de escaneo bordeada por el marco y cubra el paso del marco con más etanol si es necesario.
      NOTA: Absténgase de agregar demasiado etanol para evitar que los organismos floten y se desplacen.
    4. Homogeneice la muestra en toda el área del marco, colocando los individuos más grandes en el centro de la bandeja para un procesamiento adecuado de la imagen, y hunda los organismos flotantes con una aguja de madera.
      NOTA: Si una submuestra contiene numéricamente más de 1,000 individuos, divida la submuestra en dos o más fracciones para minimizar el contacto con organismos en la imagen escaneada y escanee las fracciones por separado.
    5. Separe los organismos que tocan y los organismos que tocan los bordes del marco con la aguja de madera.
      NOTA: Este paso requiere 5-20 min. Los organismos que tocan son considerados un solo objeto por el software; Por lo tanto, en esos casos, los tamaños individuales calculados no corresponden a organismos individuales reales y pueden sesgar la estimación de la estructura del tamaño de la comunidad. Existe la posibilidad de editar la imagen con el software de procesamiento de imágenes para separarlas, pero este paso adicional implica al menos 1,5 h de reprocesamiento; Por lo tanto, la separación manual es muy recomendable.
    6. Para escanear la muestra, cierre la tapa del escáner, vaya al software de procesamiento de imágenes, seleccione el proyecto de trabajo y haga clic en SCAN Sample with Zooscan (For Archive, No Process).
    7. Seleccione la muestra y siga las instrucciones.
    8. Vaya al software de escaneo y haga clic en Vista previa. Asegúrese de obtener una vista previa de la imagen escaneada, verifique que no haya líneas ni puntos y espere al menos 30 s antes de comenzar otro escaneo.
    9. Después de al menos 30 s, haga clic en el botón Escanear en el software de escaneo.
      NOTA: Pulse OK en el software de procesamiento de imágenes después de pulsar Scan en el software de escaneo. No presione ninguna tecla en el teclado de la computadora y evite las vibraciones del escaneo durante el escaneo. Se generan tres archivos en la carpeta Zooscan_scan > _raw : (i) un formato de archivo de imagen etiquetado (.tif) (16 bits); ii) un documento de texto estándar denominado LOG (.txt) que registra información sobre los parámetros de escaneo; y iii) un documento de texto normalizado denominado META (.txt) con información sobre los métodos de muestreo.
    10. Verifique que el escaneo sin procesar sea correcto.
      NOTA: Si el escaneo tiene rayas claras u otros problemas visibles, considere repetir el escaneo para evitar problemas en los siguientes pasos.
  3. Recuperación de muestras
    1. Retire el marco y enjuáguelo por encima de la bandeja de escaneo con una botella de compresión llena de etanol al 70% para recuperar cualquier macroinvertebrado adherido.
    2. Levante la parte superior del escáner para recuperar todos los organismos y el etanol de la bandeja a través del embudo de recuperación de escaneo en un vaso de precipitados. Con la parte superior del escáner aún levantada, enjuague la bandeja con la botella de compresión para barrer cualquier organismo restante.
    3. Pase las muestras y el etanol del vaso de precipitados a través de una malla de 500 μm para retener los invertebrados en la malla y guárdelos nuevamente en un vial con etanol al 70%.
    4. Una vez que todas las muestras se hayan recuperado en el vial, limpie la bandeja con agua del grifo.
      NOTA: Lave la bandeja con agua del grifo entre muestras para minimizar la precipitación de etanol, que altera el procesamiento de imágenes. Enjuague el marco con agua del grifo para evitar posibles daños relacionados con el uso de etanol. Al final del día, limpie la bandeja con agua del grifo y séquela suavemente con papel para evitar arañazos.
  4. Tratamiento de imágenes
    1. Vaya al software de procesamiento de imágenes y seleccione CONVERTIR y PROCESAR imágenes y organismos en modo por lotes y luego Convertir y procesar imagen Y partículas (imagen en carpeta RAW). Mantenga la configuración predeterminada y haga clic en Aceptar. NORMAL END aparecerá al final del proceso.
      NOTA: Un archivo PID y las viñetas correspondientes a todos los objetos detectados en la imagen escaneada (en un archivo Joint Photographic Group [.jpg]) se crearán en la carpeta Zooscan_scan > _work. Un archivo PID es un único archivo que almacena todos los metadatos (metarchivo), los datos técnicos asociados con el archivo de registro y una tabla con 36 variables medidas de todos los objetos detectados en la imagen. Las variables medidas corresponden a diferentes estimaciones de nivel de gris, dimensión fractal, forma y tamaño. Las variables que se pueden utilizar para la estimación del tamaño son el área y los ejes mayor y menor de una elipse con un área igual al objeto (consulte la sección 3 del protocolo). El tiempo de procesamiento depende de la densidad de la imagen y las características de la computadora, y se puede iniciar entre muestras mientras se recupera y prepara la siguiente muestra. De lo contrario, se recomienda iniciar el procesamiento de las muestras escaneadas cada día en modo por lotes durante la noche y verificar el procesamiento adecuado de la imagen a la mañana siguiente.
    2. Compruebe si el fondo de la imagen procesada se resta adecuadamente de la imagen de muestra utilizando el software de procesamiento de imágenes o comprobando las imágenes de máscara (terminadas en msk1.gif) ubicadas en Zooscan_scan > _work. Si el fondo contiene áreas saturadas o muchos puntos, considere repetir el escaneo para garantizar imágenes de alta calidad.
      NOTA: Para evitar áreas saturadas en el fondo, la bandeja de escaneo debe enjuagarse con agua del grifo después de cada escaneo con etanol. También es importante (1) reducir el número de individuos escaneados (fraccionando la muestra y escaneando en diferentes pliegues); (2) asegúrese de que los organismos grandes se coloquen en el centro de la bandeja de escaneo; (3) usar etanol limpio y filtrado; (4) reducir la suciedad en las muestras; (5) asegurar que el volumen de etanol para el escaneo sea adecuado; y (6) asegúrese de que el retraso entre la vista previa de la muestra y el escaneo sea de al menos 30 s.
  5. Separación de organismos que tocan
    NOTA: Cuando hay varias viñetas con organismos que tocan, es necesario separar las imágenes de los organismos que tocan de otros organismos y / o de fibras / desechos para garantizar una estimación adecuada de la estructura del tamaño de la comunidad.
    1. Vaya al software de procesamiento de imágenes para detectar las viñetas con múltiples objetos. Seleccione SEPARACIÓN usando viñetas y presione OK. En la ventana de selección de configuración, mantenga la configuración predeterminada y haga clic en Aceptar.
    2. En la ventana SEPARACIÓN de viñetas , mantenga la configuración predeterminada, seleccione adicionalmente AGREGAR contornos en viñetas y, a continuación, seleccione la muestra que desea editar.
    3. Separe los organismos que tocan en cada viñeta que aparece dibujando una línea con el mouse (presione el botón de rodar para dibujar). Una vez completada la separación en una viñeta, haga clic en el botón X en la esquina superior derecha de la ventana y presione para procesar la siguiente. Presione NO para finalizar y guardar los cambios. Al final del proceso, aparecerá NORMAL END si todo es correcto.
    4. Después de la separación, vuelva a procesar la imagen para obtener los datos de objeto actualizados. Vaya al software de procesamiento de imágenes, haga clic en PROCESAR (Convertido) Imagen (Proceso Uno) y seleccione Procesar de nuevo partículas de imágenes procesadas en subcarpetas WORK. Seleccione la muestra y, en la ventana Proceso de imagen única , mantenga la configuración predeterminada, marque Trabajar con máscara de separación (CREATE-MODIFY-INCLUDE) y, a continuación, haga clic en Aceptar. Al final del proceso, aparecerá NORMAL END si todo es correcto.
    5. En la ventana Control de separación , pulse OK para guardar la imagen con los contornos antes del procesamiento; Si existe una imagen anterior, se reemplazará.
    6. En la ventana Máscara de control de separación , si es necesario, seleccione EDITAR para agregar líneas de separación a la máscara usando el mouse para separar los organismos que tocan los que no han aparecido antes en el paso de separación usando viñetas. Cuando haya terminado, finalice el proceso y, en la ventana Control de máscara de separación , seleccione para aceptar la máscara. Al final del proceso, aparecerá NORMAL END si todo es correcto.
      NOTA: El reprocesamiento de una muestra con una máscara de separación lleva mucho tiempo (esto podría tomar más de 1,5 h por muestra). Es preferible dedicar el tiempo requerido en el paso 1.2.5 para evitar este paso adicional.

2. Reconocimiento automático de los objetos

NOTA: Cree un conjunto de aprendizaje para predecir automáticamente la identidad de los objetos detectados, separando así los organismos de los desechos en la muestra.

  1. Creación de conjuntos de aprendizaje
    1. Copie las imágenes y los archivos .pid asociados con las imágenes que se utilizarán para crear las categorías del conjunto de aprendizaje de Zooscan_scan > _work a PID_process > Unsorted_vignettes_pid.
      NOTA: Seleccione un subconjunto de muestras con alta diversidad de taxones y diferentes sitios de muestreo y/o temporadas de muestreo para garantizar la máxima representatividad de los organismos en las muestras.
    2. En la carpeta PID_process > conjunto de aprendizaje, cree una subcarpeta con el nombre del nuevo conjunto de aprendizaje (es decir, yyyymmdd_raw_LS) y, dentro de ella, cree las subcarpetas que corresponderán a cada categoría del conjunto de aprendizaje (es decir, macroinvertebrados, escombros, otros invertebrados).
      NOTA: Para obtener eficientemente la estructura del tamaño de la comunidad de las muestras de macroinvertebrados de río, se recomienda utilizar un conjunto de aprendizaje basado en solo tres categorías: macroinvertebrados, otros invertebrados y desechos. Este conjunto de aprendizaje básicamente separa las viñetas de los objetos correspondientes a los organismos de los correspondientes a los desechos (por ejemplo, fibras, partículas o algas filamentosas).
    3. Vaya al software de procesamiento de imágenes (solo modo avanzado) y elija EXTRAER viñetas para IDENTIFICADOR DE PLANCTON (viñetas sin clasificar para entrenamiento). Mantenga las opciones predeterminadas y marque la casilla Agregar contornos .
    4. Vaya al software de identificación automática, haga clic en Aprendizaje, seleccione de PID_process > Learning_set la subcarpeta creada para el nuevo conjunto de aprendizaje (paso 2.1.2) y presione OK.
    5. En la sección izquierda (Pulgares sin ordenar) de la ventana abierta, seleccione la carpeta Sin ordenar vignettes_pid. Seleccione las viñetas y arrástrelas con el ratón desde los pulgares sin clasificar a la carpeta de su categoría correspondiente en la sección derecha, Pulgares ordenados, para clasificar cada objeto en las categorías definidas. Las viñetas movidas se marcarán con una X roja.
      NOTA: Defina las categorías manualmente creando subcarpetas en la carpeta de pulgares ordenados o créelas haciendo clic en el icono de carpetas en el software. No mueva más de 50 viñetas al mismo tiempo.
    6. Una vez completadas todas las categorías con los objetos seleccionados (unos 300 objetos por categoría), haga clic en Crear archivo de aprendizaje y guárdelo con el nombre deseado.
      NOTA: El conjunto de aprendizaje se guardará como un archivo .pid en la carpeta PID_process > conjunto de aprendizaje del proyecto. Se recomienda crear y probar varios conjuntos de aprendizaje con diferentes niveles de categorías (desde formas gruesas hasta finas) y con un equilibrio diferente del número de objetos dentro de cada categoría. Comience con un conjunto de aprendizaje grueso con un número bajo de categorías y al menos 50 objetos por categoría, y luego aumente el número de objetos en cada categoría y / o cree conjuntos de aprendizaje más finos. Una categoría debe ser representativa de su variabilidad en el conjunto de muestras.
  2. Evaluación del conjunto de aprendizaje
    NOTA: Realice la validación cruzada con dos pliegues y cinco ensayos utilizando el método Random Forest con el software de identificación automática para obtener una matriz de confusión de la clasificación resultante de los objetos.
    1. Vaya al software de clasificación automática y haga clic en Análisis de datos.
    2. En Seleccionar archivo de aprendizaje, seleccione el archivo de conjunto de aprendizaje creado en PID_process > conjunto de aprendizaje.
    3. En Seleccionar un método, elija el método de bosque aleatorio de validación cruzada . En Variables originales, desmarque las variables de posición (X, Y, XM, YM, BX, BY y Altura). En Variables personalizadas, marque solo ESD.
      NOTA: Este método utiliza una parte aleatoria del conjunto de aprendizaje para reconocer la otra parte (dos pliegues), y esto se repite cinco veces para garantizar que sea estadísticamente robusto.
    4. Haga clic en Iniciar análisis y guarde los resultados como Analysis_name.txt en la carpeta PID_process > Predicción. Cuando el análisis se haya completado correctamente, salga del análisis de datos.
    5. Vaya a la carpeta PID_process > Prediction y haga clic en el archivo de validación cruzada. Aparecerá una ventana con la matriz de confusión de la clasificación verdadera (filas) frente a la clasificación automática (columnas).
      NOTA: El recuerdo es el porcentaje de organismos pertenecientes a un grupo que fue automáticamente bien reconocido, mientras que la precisión 1 es el porcentaje de organismos clasificados por el algoritmo como un grupo que no se reconoce (contaminación en un grupo). La retirada debe ser superior al 70%, y la contaminación (precisión 1) debe ser inferior al 20%.
    6. Repita los pasos 2.1-2.5 si se crearon varios conjuntos de aprendizaje y se debe obtener la recuperación y la precisión 1 de cada uno.
      NOTA: Si se han creado varios conjuntos de aprendizaje, elija el que tenga el mayor recuerdo (buen reconocimiento) y precisión (baja contaminación) del grupo de interés (es decir, macroinvertebrados) para probar la predicción automática de un conjunto de muestras en el siguiente paso.
  3. Predicción de la identificación de macroinvertebrados
    NOTA: Utilice el conjunto de aprendizaje seleccionado para predecir la identidad de todos los objetos de un subconjunto de muestras utilizando el software de identificación automática con un algoritmo de bosque aleatorio.
    1. Vaya al software de identificación automática y haga clic en Análisis de datos.
    2. En Seleccionar archivo de aprendizaje, seleccione el archivo de conjunto de aprendizaje de PID_process > conjunto de aprendizaje que se debe usar para la predicción.
    3. En Seleccionar archivo(s) de muestra, seleccione en la carpeta PID_results las muestras (archivos PID) que se van a predecir.
      Nota: Procese un máximo de 20 archivos .pid al mismo tiempo para evitar errores relacionados con problemas de memoria. Si se procesan demasiados archivos .pid al mismo tiempo, el proceso mostrará un final correcto, pero es posible que no se procese bien, y puede producirse un error en los siguientes pasos al procesar con el software de procesamiento de imágenes.
    4. En Seleccionar un método, elija el método Bosque aleatorio . Marque Guardar resultados detallados para cada muestra. En Variables originales, desmarque las variables de posición (X, Y, XM, YM, BX, BY y Height). En Variables personalizadas, marque solo ESD.
    5. Haga clic en Iniciar análisis y guarde los resultados como Analysis_name.txt en la carpeta PID_process > Predicción.
  4. Validación manual
    NOTA: Un experto valida manualmente la predicción del paso anterior para reclasificar los objetos clasificados erróneamente en la categoría correcta.
    1. Copie los archivos Analysis_sample_dat1.txt que se van a validar de la carpeta PID_process > Predicción a la carpeta PID_process > Pid_results.
    2. Vaya al software de procesamiento de imágenes y seleccione EXTRAER viñetas en carpetas según PREDICCIÓN o VALIDACIÓN. Luego, seleccione Usar archivos PREDICTADOS de la carpeta "pid_results". Mantenga la configuración predeterminada y pulse OK.
    3. El software crea una carpeta llamada sample_yyyymmdd_hhmm_to_validate con los objetos previstos en la carpeta PID_process > viñetas ordenadas.
    4. Vaya a la carpeta PID_process > Viñetas ordenadas y copie la carpeta sample_yyyymmdd_ hhmm_to_validate. Reemplace el nombre de la carpeta _to validar con _validated.
    5. Para validar manualmente la clasificación automática, abra la sample_yyyymmdd_ hhmm_validated de carpeta y revise todas las viñetas de cada subcarpeta (categoría) para identificar si hay objetos clasificados erróneamente. Cuando un objeto está mal clasificado, arrastre la viñeta con el ratón a la carpeta (categoría) correcta.
    6. Vaya al software de procesamiento de imágenes y seleccione CARGAR identificaciones de viñetas ordenadas. Mantenga la configuración predeterminada y seleccione yyyymmdd_hhmm_name_validated que desea procesar.
    7. Vaya a PID_process > Pid_results > Dat1_validated, donde se han creado un archivo denominado Id_from_sorted_vignettes_yyyymmdd_hhmm.txt y un archivo .txt para cada una de las muestras validadas (sample_tot_1_dat1.txt).
      Nota: Estos archivos .txt contienen una nueva columna que presenta la predicción, denominada pred_valid_Id_yyyymmdd_hhmm, que especifica la clasificación experta de cada objeto (es decir, la clasificación validada). Se podrían crear nuevas categorías (por ejemplo, categorías taxonómicas más finas) en este punto, durante la validación. Sin embargo, mantenga el nombre de la categoría original en el nuevo nombre (por ejemplo, macroinvertebrate_chironomidae). Esto permite volver sobre la categoría original al calcular el recuerdo y la precisión y agrupar fácilmente todos los macroinvertebrados para calcular los parámetros de la estructura del tamaño de la comunidad (es decir, el espectro de tamaño y la diversidad de tamaños). El archivo de texto proporciona los datos asociados con cada objeto, incluidos los ejes menor y mayor que se utilizan para obtener el volumen elipsoidal de cada organismo como medida del tamaño corporal individual. Además, las dos últimas columnas de la tabla contienen las categorías predichas y validadas de cada objeto (fila), que permiten calcular, por categoría, el recuerdo y la precisión del conjunto de aprendizaje en el subconjunto de muestras.Figure 1

Figura 1: Diagrama de trabajo que representa la sección 1 y la sección 2 del protocolo. Los tiempos son ilustrativos y pueden cambiar dependiendo de la computadora, la abundancia de viñetas para procesar y el número de categorías del conjunto de aprendizaje. Este caso corresponde a la validación de un conjunto de aprendizaje de tres categorías en un conjunto de 42 submuestras (en total, 47.473 viñetas). Haga clic aquí para ver una versión más grande de esta figura.

3. Calcular la distribución de tamaño individual, los espectros de tamaño y las métricas de tamaño

NOTA: Los cálculos mencionados en esta sección se realizaron utilizando Matlab (consulte el script como archivo complementario 1).

  1. Distribución individual del tamaño
    1. La última columna del archivo de Id_from_sorted_vignettes_YYYYMMDD_HHHH.txt contiene la clasificación validada de los objetos. Seleccione solo los objetos clasificados como macroinvertebrados para representar su distribución de tamaño individual en la muestra.
      NOTA: El tamaño corporal individual corresponde al volumen elipsoidal de los organismos macroinvertebrados. El sistema proporciona mediciones en píxeles.
    2. Concatena los vectores con las medidas de tamaño de ambos escaneos, porque cada fracción tiene un exponente de submuestreo diferente. Antes de la concatenación, corrija el fraccionamiento replicando los vectores de tamaño tantas veces como se haya fraccionado la submuestra correspondiente.
      NOTA: Este paso es necesario si una exploración corresponde a una fracción de una muestra (es decir, gruesa o fina).
    3. Calcula el volumen elipsoidal a partir de los ejes mayor (M) y menor (m) de los elipsoides prolatos con las mismas áreas de píxeles que los organismos. Antes de calcular el volumen elipsoidal, convierta los ejes mayor (M) y menor (m) de píxeles a milímetros (mm) con el siguiente factor de conversión (cf):
      1 píxel = 2.400 ppp
      1 pulgada = 25,4 mm
      cf = 25,4/2400
      El volumen elipsoidal (elipVol con unidades en mm3) corresponde a:
      Equation 1
    4. Representar la función de densidad de probabilidad de la distribución de tamaño individual en la escala logarítmica2 .
  2. Diversidad de tamaños
    1. Calcule la diversidad de tallas (Sd) siguiendo a Quintana et al. (2008)8, como en García-Comas et al. (2016)35:
      Equation 2
      donde p x(x) es la función de densidad de probabilidad de tamaño x, y x representa log2 (elipVol). Esta medida es, por lo tanto, el índice de diversidad de Shannon adaptado a una medida continua, como la distribución del tamaño individual en una comunidad.
  3. Espectro normalizado de tamaño de biovolumen (NBSS)
    1. Definir las clases de tamaño de la NBSS, estableciendo el límite inferior del espectro como el cuantil 0.01 de la distribución de tamaño de macroinvertebrados en las muestras y creando clases de tamaño por una escala geométrica de base 2 hasta que se abarque el organismo más grande en las muestras.
      NOTA: El ancho de clase de tamaño aumenta con el tamaño para tener en cuenta la mayor variabilidad asociada con tamaños mayores. Las NBSS de las comunidades de macroinvertebrados analizadas aquí tuvieron 14 clases de tamaño (Tabla 1).
    2. Obtenga el biovolumen normalizado dividiendo el biovolumen total en cada clase de tamaño por el ancho de la clase de tamaño.
  4. Pendiente del espectro de tamaño
    1. Calcular la pendiente lineal del NBSS.
      NOTA: La pendiente (μ) se calcula en función de la relación entre el log 2 (punto medio de la clase de tamaño) y el log2 (biomasa normalizada) en las clases de tamaño mayores que el modo, ignorando las vacías (en este estudio, las clases de tamaño de 3 a 14).
Límites de clase de tamaño (mm3) Clase de tamaño punto medio (mm3)
0,1236 0,1855
0,2473 0,3709
0,4946 0,7418
0,9891 1,4837
1,9783 1,4837
3,9560 5,9348
7,9131 11,8696
15,8261 23,7392
31,6522 47,4783
63,3044 94,9567
126,6089 189,9133
253,2178 379,8267
506,4300 7597,7000
1012,9000 15193,0000
2025,7000

Tabla 1: Clases de tamaño del espectro normalizado de tamaño de biomasa (NBSS). La tabla también muestra los límites de clase de tamaño 15 y los puntos medios de clase de tamaño de los organismos.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Adquisición de imágenes digitales de muestras de macroinvertebrados
Matices de escaneo: Deposición de etanol en la bandeja de escaneo
Mientras probaban el sistema para macroinvertebrados, varios escaneos fueron de mala calidad. Un área oscura saturada en el fondo impidió el procesamiento normal de la imagen y la medición de los tamaños individuales de los macroinvertebrados (Figura 2). Se han dado varias razones para la aparición de áreas saturadas en el fondo o imágenes altamente pixeladas: (1) la presencia de demasiados organismos en la bandeja de escaneo; (2) la presencia de suciedad en las muestras; (3) un retraso insuficiente entre la vista previa de la muestra y su escaneo; o (4) utilizar en el procesamiento de imágenes una imagen de fondo de mala calidad debido a la condensación, suciedad o mala calidad del agua33. En muestras de comunidades de macroinvertebrados, el uso de etanol en lugar de agua causa precipitación en la bandeja, que forma una sombra oscura si no se enjuaga adecuadamente con agua entre escaneos. Esto es vital para obtener imágenes nítidas y minimizar cualquier corrosión relacionada con el vidrio de la bandeja de escaneo.

Matices de escaneo: concentración de escombros
Del análisis de un subconjunto de 47.473 viñetas, un alto porcentaje (86,1%) correspondió a escombros, incluyendo detritus, fibras o partes del cuerpo (como patas o branquias), o artefactos de escaneo (Figura 3A-E). Los organismos invertebrados correspondieron al 13,9% restante de los objetos detectados (Figura 3F-L). Por lo tanto, a pesar de la meticulosa separación previa de organismos de materia orgánica en el laboratorio, aún quedaban muchos restos pequeños en el vial.

Escanear matices: tocar objetos
La presencia significativa de desechos mejora el contacto entre organismos y, por lo tanto, la creación de viñetas con agregados que incluyen múltiples organismos que se tocan y organismos unidos a partículas o fibras (Figura 4A-C). Estas viñetas son una fuente de sesgo en la determinación de la forma de la estructura de tamaño individual. En un conjunto de cinco muestras (11 submuestras), de todas las viñetas con macroinvertebrados, el 10% correspondió a grupos con organismos que tocaban u organismos que tocaban partículas o fibras. Esas viñetas fueron editadas con el programa de procesamiento de imágenes para separar los organismos que tocan y los organismos con partículas adheridas. El reprocesamiento de las muestras con la máscara de separación implicó la creación de nuevas viñetas con los objetos recién separados, que fueron validadas para asegurar su correcta clasificación.

Reconocimiento automático de los objetos
Resultados del conjunto de aprendizaje
Un conjunto de aprendizaje es un conjunto de viñetas de objetos clasificados en diferentes categorías por un experto y utilizados en un modelo de aprendizaje supervisado, y esto también se puede llamar un conjunto de entrenamiento27. Es posible trabajar con un conjunto de aprendizaje existente, actualizar el conjunto de aprendizaje existente con nuevas viñetas y / o categorías, o crear un nuevo conjunto de aprendizaje para un proyecto específico.

Para determinar el mejor conjunto de aprendizaje para obtener rápidamente la estructura de tamaño de los macroinvertebrados, se crearon y probaron varios conjuntos de aprendizaje mediante validación cruzada con el algoritmo Random Forest. La matriz de confusión resultante muestra la clasificación verdadera (filas) frente a la clasificación automática (columnas). El recuerdo es el porcentaje de organismos pertenecientes a una categoría que fue automáticamente bien clasificada, mientras que la precisión 1 es el porcentaje de organismos mal clasificados por el algoritmo como pertenecientes a una categoría (contaminación en una categoría)33. Como regla general, el retiro debe ser superior al 70%, y la contaminación (precisión 1) debe ser inferior al 20% para mantener una categoría en el conjunto de aprendizaje. El conjunto de aprendizaje con el mayor recuerdo y precisión para macroinvertebrados se valida con un subconjunto de muestras para determinar su precisión real en la identificación de macroinvertebrados.

Se probaron tres tipos de conjuntos de aprendizaje atáxico (crudo, intermedio y fino) con categorías basadas en las características morfológicas de los objetos. El conjunto de aprendizaje en bruto incluía tres categorías: macroinvertebrados, otros invertebrados (microcrustáceos) y desechos (fibras, partículas y artefactos como manchas de vidrio). El conjunto de aprendizaje intermedio incluyó 16 categorías: 5 para macroinvertebrados, 3 para otros invertebrados y 8 para desechos. El conjunto de aprendizaje fino incluyó 4 categorías más de macroinvertebrados, con un total de 20 categorías (Tabla 2).

Además de definir las categorías, también se probó el efecto del número de viñetas por categoría. Cada conjunto de aprendizaje se probó por separado utilizando 50 viñetas, 100 viñetas y 300 viñetas en cada categoría (y 500 viñetas para el conjunto de aprendizaje sin procesar con tres categorías). Todas las categorías estaban equilibradas en número, excepto "Ostracoda", "macroinvertebrados de ronda larga" y "macroinvertebrados de concha redonda", que incluyeron menos individuos en los conjuntos de aprendizaje de 100 viñetas y 300 viñetas porque no se detectaron suficientes organismos de estas categorías en las imágenes escaneadas.

Se consideró que el recuerdo y la precisión de los macroinvertebrados (todas las categorías de macroinverebrate juntas) y los organismos (las categorías de macroinvertebrados y otras categorías de invertebrados juntas) seleccionaron el mejor conjunto de aprendizaje mediante validación cruzada (véanse los cuadros del archivo complementario 2). El mejor conjunto de aprendizaje fue el conjunto de aprendizaje bruto con tres categorías (macroinvertebrados, otros invertebrados y desechos), con 300 objetos en cada categoría (Tabla 2). El conjunto de aprendizaje sin procesar se utilizó posteriormente para validar la clasificación automática de los objetos en el subconjunto de muestras escaneadas.

Conjunto de aprendizaje Número de categorías Imágenes por categoría Recordar organismos Recordemos los macroinvertebrados 1-Organismos de precisión Macroinvertebrados de precisión 1
Crudo 3 50 0.97 0.84 0.12 0.24
100 0.96 0.87 0.06 0.17
300 0.95 0.91 0.09 0.15
500 0.93 0.88 0.13 0.2
Medio 16 50 0.83 0.77 0.17 0.24
100 0.84 0.79 0.15 0.21
300 0.87 0.84 0.14 0.18
Multa 20 50 0.89 0.86 0.14 0.18
100 0.9 0.87 0.11 0.14
300 0.9 0.86 0.13 0.14

Tabla 2: Conjuntos de aprendizaje creados y probados (raw, intermedio y fino) con las categorías dentro de cada uno y el número de objetos por categoría. Recuerdo y 1-precisión de los conjuntos de aprendizaje creados. Categorías del conjunto de aprendizaje Raw: Macroinvertebrados (1), Otros invertebrados (2), Escombros (3). Categorías del conjunto de aprendizaje medio: macroinvertebrados largos (1), macroinvertebrados largos y lisos (2), macroinvertebrados puntiagudos largos (3), macroinvertebrados redondos (4), macroinvertebrados de concha redonda (5), cladócera (6), copépodos (7), ostracoda (8), agregados (9), fibras (10), cabezas (11), patas (12), manchas (13), manchas oscuras (14), manchas grises claras (15), manchas redondas (16). categorías del conjunto de aprendizaje fino: macroinvertebrados largos (1), macroinvertebrados largos lisos (2), macroinvertebrados oscuros largos lisos (3), macroinvertebrados redondos largos (4), macroinvertebrados puntiagudos largos (5), macroinvertebrados redondos (6), macroinvertebrados de concha redonda (7), macroinvertebrados oscuros redondos (8), macroinvertebrados de concha redonda (9), cladóceras (10), copépodos (11), ostracoda (12), agregados (13), fibras (14), cabezas (15), patas (16), manchas (17), Manchas oscuras (18), manchas gris claro (19), manchas redondas (20).

Validación del reconocimiento automático con el mejor conjunto de aprendizaje
Los objetos en un subconjunto de 42 submuestras finas y gruesas fueron clasificados automáticamente por el conjunto de aprendizaje seleccionado con el algoritmo Random Forest. Después de la validación manual, el retiro para todas las categorías fue alto (en promedio, 0.94 para macroinvertebrados, 0.95 para otros invertebrados y 0.92 para desechos), mientras que la contaminación (precisión 1) fue bastante baja, excepto para otros invertebrados (0.25 para macroinvertebrados, 0.84 para otros macroinvertebrados y 0.01 para desechos) (Figura 5 ). Otros invertebrados (microcrustáceos) fueron raros en las muestras (presentes en 17 de 42 submuestras); Por lo tanto, la comparación no fue sólida. Además, esta categoría se vio muy afectada por la contaminación debido a la similitud en forma y niveles de gris con otros objetos.

La comparación de la abundancia automática versus validada de macroinvertebrados mostró que estos estaban altamente correlacionados (r de Pearson = 0,92, valor de p < 0,0001, n = 24 para submuestras gruesas; r de Pearson = 0,98, valor p < 0,0001, n = 18 para submuestras finas), con una ligera sobreestimación por el rendimiento automático debido a la contaminación por escombros (pendientes < 1) (Figura 6). En cuanto a la comparación del volumen elipsoidal medio, la correlación también fue alta (r de Pearson = 0,96, valor de p < 0,0001, n = 24 para muestras gruesas; r de Pearson = 0,99, valor p < 0,0001, n = 18 para muestras finas), y la pendiente del espectro de tamaño fue cercana a −1 (Figura 6). La diferencia en las pendientes entre las fracciones finas y gruesas refleja el mayor efecto de clasificación errónea en las fracciones de gran tamaño, que está relacionado con sus bajos recuentos de organismos.

Las funciones de densidad de probabilidad de las distribuciones de tamaño individuales de la predicción automática coincidieron fuertemente con las predicciones validadas para las submuestras finas, así como para las submuestras gruesas. Sin embargo, hubo algunas excepciones para las submuestras gruesas relacionadas con el número de organismos y, por lo tanto, un mayor efecto de clasificación errónea en esos casos, como se destacó anteriormente (Figura 7).

Efecto de tocar organismos en las distribuciones de tamaño individuales, espectros de tamaño y métricas de tamaño
Se realizó una comparación de las distribuciones de tamaño obtenidas antes y después de la separación de los organismos que tocan y antes de la validación en un subconjunto de cinco muestras seleccionadas para evaluar el efecto de tocar objetos. Para comparar las distribuciones de tamaño, se combinaron las submuestras gruesa y fina, de acuerdo con su fraccionamiento, para reconstruir una muestra representativa de la comunidad de macroinvertebrados. En tres muestras, la abundancia después de la validación aumentó (>500 individuos) (Figura 8A). A pesar de este aumento, el volumen elipsoidal medio se ajusta mucho al calculado en las muestras validadas (Figura 8B).

Las distribuciones de tamaño de las muestras corregidas (después de la separación de los organismos que tocan) difirieron ligeramente de las validadas. Por lo tanto, la presencia de múltiples objetos tuvo una pequeña influencia en las distribuciones de tamaño en esas muestras (Figura 9A-E). En consecuencia, la diversidad de tamaños calculada en base a las muestras corregidas se correlacionó fuertemente con la diversidad de tamaños de las validadas (r de Pearson = 0,94, valor p = 0,017, n = 5) (Figura 9F).

Teóricamente, el espectro normalizado de tamaño de biovolumen (NBSS) de una comunidad con varios niveles tróficos tiene una pendiente de espectro de tamaño en la escala logarítmica2 cercana a −1 en condiciones de estado estacionario4. La NBSS en las comunidades naturales a menudo tiene una protuberancia en lugar de una distribución lineal, y esto se atribuye principalmente al sesgo de muestreo de las clases de tamaño más pequeño36. En el presente estudio, la tercera clase de tamaño fue la más común en la NBSS.

Las NBSS fueron bastante similares entre los pasos del protocolo (Figura 10A-C), excepto por unas pocas clases de tamaño en un par de espectros (Figura 10D-E). En consecuencia, la pendiente del espectro de tamaño calculada en base a las muestras corregidas se correlacionó fuertemente con la pendiente basada en las validadas (r de Pearson = 0.99, valor p ≤ 0.0001, n = 5) (Figura 10F).

Figure 2
Figura 2: Ejemplos de imágenes escaneadas con diferentes calidades antes y después de ser procesadas. (A,B) Imagen en bruto (izquierda) e imagen procesada (derecha) de una submuestra fina con buena calidad de escaneo; (C,D) Imagen sin procesar (izquierda) e imagen procesada (derecha) de una submuestra fina con mala calidad de escaneo (fondo oscuro e imagen cortada en el borde izquierdo); (E,F) imagen en bruto (izquierda) e imagen procesada (derecha) de una submuestra fina con mala calidad de escaneo (fondo oscuro muy pixelado). Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3: Viñetas de contorno que representan diferentes objetos presentes en las muestras. (A-E) Desechos (fibra, mancha redonda, pierna de macroinvertebrado, manchas y desechos orgánicos); (F-I) macroinvertebrados (Coleoptera, Diptera, Plecoptera, y Trichoptera) y (J-L) otros invertebrados (Cladocera, Copepoda y Ostracoda). Las barras de escala indican 1 mm gma = 1.1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 4
Figura 4: Ejemplos de viñetas que contienen múltiples objetos. (A) Un macroinvertebrado (Hydracarina) unido a una fibra; (B) múltiples organismos (Caenidae) agregados por una fibra; y (C) dos macroinvertebrados que se tocan (Chironomidae y Caenidae). Las barras de escala indican 1 mm gma = 1.1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 5
Figura 5: Diagramas de recuperación y contaminación (precisión 1). Los diagramas de caja para las tres categorías de macroinvertebrados, otros invertebrados y desechos (300 viñetas por categoría) del conjunto de aprendizaje seleccionado validados en un subconjunto de muestras (n = 42). Haga clic aquí para ver una versión más grande de esta figura.

Figure 6
Figura 6: Comparación entre las estimaciones de abundancia y volumen elipsoidal medio en clasificación automática versus validada. (A) Estimaciones de abundancia en las submuestras (n = 42) y (B) estimaciones del volumen elipsoidal medio en las submuestras (n = 42). Los puntos oscuros corresponden a las submuestras gruesas (malla de >0,5 cm); Los puntos grises corresponden a las submuestras finas (malla de >500 μm). La línea discontinua representa la relación 1:1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 7
Figura 7: Funciones de densidad de probabilidad que representan la contribución relativa (eje y) del tamaño individual en la escala logarítmica (eje x) para la comparación entre estimaciones automáticas y entre estimaciones validadas. (A,B) Estimaciones automáticas y validadas para submuestras gruesas (n = 18), (C,D) Estimaciones automáticas y validadas para submuestras finas (n = 24). (A,C) Comparación entre estimaciones automáticas y (B,D) comparación entre estimaciones validadas. Los colores representan cada submuestra para ayudar a discernir los espectros. Haga clic aquí para ver una versión más grande de esta figura.

Figure 8
Figura 8: Comparación entre las estimaciones de abundancia y volumen elipsoidal medio en submuestras validadas versus submuestras validadas después de la separación de objetos en contacto de muestras naturales seleccionadas (submuestras finas y gruesas juntas). (A) Estimaciones de abundancia por marco de muestreo (n = 5) y (B) estimaciones del volumen elipsoidal medio (n = 5). La línea discontinua representa la relación 1:1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 9
Figura 9: Funciones de densidad de probabilidad que representan la contribución relativa (eje y) del tamaño individual en la escala logarítmica2 (eje x) para la predicción automática, la predicción validada y la predicción validada con sus respectivos valores de diversidad de tamaño (Sd). (A-E) Funciones de densidad de probabilidad para muestras naturales seleccionadas (submuestras finas y gruesas juntas) (n = 5); La línea roja corresponde a la predicción automática, la línea azul corresponde a la predicción validada y la línea verde corresponde a las muestras corregidas (validadas después de la separación de objetos que tocan). F) Comparación de estimaciones validadas con estimaciones de diversidad de tallas corregidas; La línea discontinua corresponde a la relación 1:1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 10
Figura 10: Espectros normalizados de tamaño de biovolumen (NBSS) y comparación de las pendientes de NBSS (μ) entre tratamientos. (A-E) NBSS que representa la relación entre el valor de punto medio de cada clase de tamaño en la escala logarítmica (eje x) frente al biovolumen normalizado por marco de escaneo (eje y) de las cinco muestras seleccionadas para las predicciones automáticas (cruces rojas), validadas (triángulos azules) y corregidas (círculos verdes) con su respectivo espectro de tamaño pendientes (μ) calculadas en las clases de tamaño a partir de la clase de tamaño modal y hacia arriba (la tercera clase de tamaño se indica mediante la línea discontinua vertical). (F) Comparación de las pendientes calculadas sobre las muestras validadas versus las corregidas (después de la separación de objetos que tocan). La línea discontinua corresponde a la relación 1:1, r2. Haga clic aquí para ver una versión más grande de esta figura.

Archivo complementario 1: script de Matlab para realizar los cálculos. Haga clic aquí para descargar este archivo.

Archivo complementario 2: Validación cruzada, recuperación y precisión 1 de los conjuntos de aprendizaje creados. (A) Conjunto de aprendizaje bruto con 3 categorías y 50 viñetas por categoría; (B) conjunto de aprendizaje bruto con 3 categorías y 100 viñetas por categoría; (C) conjunto de aprendizaje bruto con 3 categorías y 300 viñetas por categoría; (D) conjunto de aprendizaje bruto con 3 categorías y 500 viñetas por categoría; (E) conjunto de aprendizaje bruto con 5 categorías y 50 viñetas por categoría; (F) conjunto de aprendizaje bruto con 5 categorías y 100 viñetas por categoría; (G) conjunto de aprendizaje bruto con 5 categorías y 300 viñetas por categoría; (H) conjunto de aprendizaje intermedio con 16 categorías y 50 viñetas por categoría; (I) conjunto de aprendizaje intermedio con 16 categorías y 100 viñetas por categoría; J) conjunto de aprendizaje intermedio con 16 categorías y 300 viñetas por categoría; (K) conjunto de aprendizaje fino con 20 categorías y 50 viñetas por categoría; (L) buen conjunto de aprendizaje con 20 categorías y 100 viñetas por categoría; y (M) conjunto de aprendizaje fino con 20 categorías y 300 viñetas por categoría. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

La adaptación de la metodología descrita por Gorsky et al. 2010 para macroinvertebrados ribereños permite una alta precisión de clasificación en la estimación de la estructura del tamaño de la comunidad en macroinvertebrados de agua dulce. Los resultados sugieren que el protocolo puede reducir el tiempo para estimar la estructura de tamaño individual en una muestra a aproximadamente 1 hora. Por lo tanto, el protocolo propuesto está destinado a promover el uso rutinario de espectros de tamaño de macroinvertebrados como un bioindicador rápido e integrador para evaluar el impacto de las perturbaciones en los ecosistemas de agua dulce. El espectro de tamaño de macroinvertebrados ya ha sido utilizado como un índice exitoso para evaluar el estado ecológico de las lagunas costeras22. Con el desarrollo del protocolo, se pueden llevar a cabo estudios intensivos en invertebrados para permitir campañas de monitoreo de campo que cubran grandes escalas espaciales y temporales.

Como el objetivo de este protocolo es obtener la distribución individual del tamaño de la comunidad muestreada de una manera rápida, sin tener en cuenta la taxonomía, se recomienda crear un conjunto de aprendizaje simple como el que aquí se propone. Las pruebas de conjuntos de aprendizaje más finos, con un mayor número de categorías, dan un menor recuerdo y precisión para los macroinvertebrados en su conjunto (Tabla 2), y el paso de validación requiere más tiempo.

La predicción automática coincidió fuertemente con la predicción validada de 42 submuestras naturales de diferentes sitios de muestreo, lo que sugiere que el método en modo automático es adecuado para contar y medir los macroinvertebrados en muestras naturales (Figura 6). Además, la similitud en las NBSS entre las predicciones automáticas y validadas y el alto ajuste al modelo teórico lineal sugiere que el modo automático es un método prometedor para realizar estudios ecológicos teóricos (Figura 10).

Durante la adaptación de este protocolo, se encontraron varios problemas, y se resolvieron o minimizaron de diferentes maneras. Un tema a tener en cuenta al escanear muestras de macroinvertebrados es la aparición de áreas saturadas oscuras. Por lo tanto, es importante verificar las imágenes procesadas y escaneadas lo antes posible para detectar este problema y repetir el escaneo si es necesario. Este problema también se ha encontrado al escanear plancton33, pero se incrementa por el uso de etanol en lugar de agua del grifo. No se recomienda usar agua del grifo, ya que los organismos conservados en etanol al 70% se desplazarán en la superficie. Aunque el dispositivo está diseñado para resistir el etanol diluido (5%), las muestras de invertebrados se conservan con etanol al 70%. Tampoco se recomienda operar con concentraciones más bajas de etanol, ya que los organismos podrían dañarse a través de procesos de rehidratación y deshidratación37. La solución propuesta, que es muy recomendable, es enjuagar la bandeja de escaneo con agua dulce varias veces después de cada escaneo realizado con etanol. Esto evita la acumulación de precipitados que pueden alterar el fondo de la imagen y protege el vidrio de la bandeja de escaneo de la corrosión.

Otro problema detectado es la presencia de viñetas con múltiples organismos, que pueden alterar el espectro de tamaño debido a la subestimación de individuos de ciertos tamaños. Cuando el número de viñetas con múltiples objetos es bajo (<10%), como en este estudio, la presencia de múltiples objetos tiene una pequeña influencia en las distribuciones de tamaño y NBSS en esas muestras (Figura 9 y Figura 10). Esto indica que, para obtener una estructura de tamaño representativa de la comunidad de macroinvertebrados, no es necesario invertir tiempo en el paso 1.5 del protocolo (la separación de organismos que tocan), para lo cual el reprocesamiento de imágenes dura aproximadamente 1.5 h. En su lugar, se recomienda encarecidamente tomar tiempo en el paso 2.5 del protocolo (separar organismos o agregados que tocan usando una aguja de madera), que requiere mucho menos tiempo (máximo 30 min) y garantiza una estimación adecuada de las distribuciones de tamaño en el modo automático30. Una opción para reducir el número de organismos que tocan es trabajar con menos organismos por exploración, pero se debe tener en cuenta el compromiso de tiempo invertido en escanear una muestra en un gran número de fracciones y la posibilidad de agregación de organismos. Otra solución sería preservar solo una submuestra que permitiera calcular un espectro de tamaño representativo al clasificar los organismos en el laboratorio en lugar de preservar todos los organismos muestreados, como se hace en este trabajo. La reducción en el número de organismos por muestra reduciría la probabilidad de tocar organismos. Además, cuando se almacenan menos individuos, la muestra contiene menos residuos, lo que facilita la separación, especialmente si se pueden evitar las fibras.

La limitación observada del método de clasificación automática está relacionada con la baja presencia de microcrustáceos (categoría: otros macroinvertebrados) en las muestras utilizadas. La falta de representación de los microcrustáceos puede afectar su correcta clasificación y limitar la precisión de la predicción automática para esta categoría. Sin embargo, las otras categorías, desechos y macroinvertebrados, que son el objetivo principal de este trabajo, presentan un alto recuerdo y precisión. Las alternativas al uso de este dispositivo de escáner serían adaptar un escáner común para contener marcos de agua, promover códigos de código abierto para el procesamiento de muestras y el aprendizaje automático como el que se proporciona aquí, y escribir códigos para medir organismos bajo el microscopio con una cámara o a través del flujo con un conjunto de cámaras. Esto se ha hecho en varias ocasiones 23,24,25,26,38,39,40, pero el método que proponemos regula la parametrización del barrido para obtener estimaciones de tamaño comparables, lo cual es difícil de controlar con los otros sistemas. Además, el protocolo propuesto y el dispositivo de escaneo están listos para usar, de código abierto y ya establecidos en la comunidad de mesozooplancton marino. En general, la adaptación de este protocolo demuestra una vía prometedora para utilizar este método automático de imágenes para obtener la estructura de tamaño de los macroinvertebrados de agua dulce de manera eficiente y para probar el potencial de las métricas de tamaño para la bioevaluación de agua dulce.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores declaran que no hay intereses potenciales en conflicto.

Acknowledgments

Este trabajo ha contado con el apoyo del Ministerio de Ciencia, Innovación y Universidades (número de subvención RTI2018-095363-B-I00). Agradecemos a los miembros del CERM-UVic-UCC Èlia Bretxa, Anna Costarrosa, Laia Jiménez, María Isabel González, Marta Jutglar, Francesc Llach y Núria Sellarès su trabajo en muestreo de campo de macroinvertebrados y clasificación de laboratorio y a David Albesa por colaborar en el escaneo de muestras. Por último, agradecemos a Josep Maria Gili y al Institut de Ciències del Mar (ICM-CSIC) el uso de las instalaciones del laboratorio y del dispositivo escáner.

Materials

Name Company Catalog Number Comments
Beaker Labbox Other containers could be used
Dionized water Icopresa  8420239600123 To dilute the ethanol
Funnel Vitlab 41094
Glass vials 8 ml Labbox SVSN-C10-195 1 vial/subsample
ImageJ Software  Free access Version 4.41o/ Image processing software
Large frame Hydroptic  Provided by ZooScan 24.5 cm x 15.8 cm
Monalcol 96 (Ethanol 96) Montplet 1050JE001
Plankton Identifier Software Free access Version 1.2.6/ Automatic identification software
Sieve Cisa 26852.2 Nominal aperture 500µ and nominal aperture 0,5 cm
Tweezers Bondline B5SA Stainless, anti-magnetic, anti-acid
VueScan 9 x 64 (9.5.09) Software Hydroptic Version 9.0.51/ Sacn software
Wooden needle Any plastic or wood needle can be used
Zooprocess Software  Free access Version 7.14/Image processing software
ZooScan  Hydroptic 54 Version III/ Scanner

DOWNLOAD MATERIALS LIST

References

  1. Birk, S., et al. Three hundred ways to assess Europe's surface waters: An almost complete overview of biological methods to implement the Water Framework Directive. Ecological Indicators. 18, 31-41 (2012).
  2. Basset, A., Sangiorgio, F., Pinna, M. Monitoring with benthic macroinvertebrates: advantages and disadvantages of body size descriptors. Aquatic Conservation: Marine and Freshwater Ecosystems. 14, S43-S58 (2004).
  3. Reyjol, Y., et al. Assessing the ecological status in the context of the European Water Framework Directive: Where do we go now. Science of the Total Environment. 497-498, 332-344 (2014).
  4. Brown, J. H., Gillooly, J. F., Allen, A. P., Savage, V. M., West, G. B. Toward a metabolic theory of ecology. Ecology. 85 (7), 1771-1789 (2004).
  5. Woodward, G., et al. Body size in ecological networks. Trends in Ecology & Evolution. 20 (7), 402-409 (2005).
  6. Sprules, W. G., Barth, L. E. Surfing the biomass size spectrum: Some remarks on history, theory, and application. Canadian Journal of Fisheries and Aquatic Sciences. 73 (4), 477-495 (2016).
  7. White, E. P., Ernest, S. K. M., Kerkhoff, A. J., Enquist, B. J. Relationships between body size and abundance in ecology. Trends in Ecology & Evolution. 22 (6), 323-330 (2007).
  8. Quintana, X. D., et al. A nonparametric method for the measurement of size diversity with emphasis on data standardization. Limnology and Oceanography - Methods. 6 (1), 75-86 (2008).
  9. Blanchard, J. L., Heneghan, R. F., Everett, J. D., Trebilco, R., Richardson, A. J. From bacteria to whales: Using functional size spectra to model marine ecosystems. Trends in Ecology & Evolution. 32 (3), 174-186 (2017).
  10. Petchey, O. L., Belgrano, A. Body-size distributions and size-spectra: Universal indicators of ecological status. Biology Letters. 6 (4), 434-437 (2010).
  11. Emmrich, M., et al. Geographical patterns in the body-size structure of European lake fish assemblages along abiotic and biotic gradients. Journal of Biogeography. 41 (12), 2221-2233 (2014).
  12. Arranz, I., Brucet, S., Bartrons, M., García-Comas, C., Benejam, L. Fish size spectra are affected by nutrient concentration and relative abundance of non-native species across streams on the NE Iberian Peninsula. Science of the Total Environment. 795, 148792 (2021).
  13. Vila-Martínez, N., Caiola, N., Ibáñez, C., Benejam, L. l, Brucet, S. Normalized abundance spectra of the fish community reflect hydropeaking on a Mediterranean large river. Ecological Indicators. 97, 280-289 (2019).
  14. Benejam, L. l, Tobes, I., Brucet, S., Miranda, R. Size spectra and other size-related variables of river fish communities: systematic changes along the altitudinal gradient on pristine Andean streams. Ecological Indicators. 90, 366-378 (2018).
  15. Sutton, I. A., Jones, N. E. Measures of fish community size structure as indicators for stream monitoring programs. Canadian Journal of Fisheries and Aquatic Sciences. 77 (5), 824-835 (2019).
  16. Murry, B. A., Farrell, J. M. Resistance of the size structure of the fish community to ecological perturbations in a large river ecosystem. Freshwater Biology. 59, 155-167 (2014).
  17. Townsend, C. R., Thompson, R. M. Body size in streams: Macroinvertebrate community size composition along natural and human-induced environmental gradients. In Body Size: The Structure and Function of Aquatic Ecosystems. Hildrew, A. G., Raffaelli, D. G., Edmonds-Brown, R. , Cambridge University Press. Cambridge, UK. (2007).
  18. Gjoni, V., et al. Patterns of functional diversity of macroinvertebrates across three aquatic ecosystem types, NE Mediterranean. Mediterranean Marine Science. 20 (4), 703-717 (2019).
  19. Pomeranz, J. P. F., Warburton, H. J., Harding, J. S. Anthropogenic mining alters macroinvertebrate size spectra in streams. Freshwater Biology. 64 (1), 81-92 (2019).
  20. García-Girón, J., et al. Anthropogenic land-use impacts on the size structure of macroinvertebrate assemblages are jointly modulated by local conditions and spatial processes. Environmental Research. 204, 112055 (2022).
  21. Demi, L. M., Benstead, J. P., Rosemond, A. D., Maerz, J. C. Experimental N and P additions alter stream macroinvertebrate community composition via taxon-level responses to shifts in detrital resource stoichiometry. Functional Ecology. 33 (5), 855-867 (2019).
  22. Basset, A., et al. A benthic macroinvertebrate size spectra index for implementing the Water Framework Directive in coastal lagoons in Mediterranean and Black Sea ecoregions. Ecological Indicators. 12 (1), 72-83 (2012).
  23. Ärje, J., et al. Automatic image-based identification and biomass estimation of invertebrates. Methods in Ecology and Evolution. 11 (8), 922-931 (2020).
  24. Raitoharju, J., et al. Benchmark database for fine-grained image classification of benthic macroinvertebrates. Image and Vision Computing. 78, 73-83 (2018).
  25. Lytle, D. A., et al. Automated processing and identification of benthic invertebrate samples. Journal of the North American Benthological Society. 29 (3), 867-874 (2010).
  26. Serna, J. P., Fernández, D. S., Vélez, F. J., Aguirre, N. J. An image processing method for recognition of four aquatic macroinvertebrates genera in freshwater environments in the Andean region of Colombia. Environmental Monitoring and Assessment. 192, 617 (2020).
  27. Gorsky, G., et al. Digital zooplankton image analysis using the ZooScan integrated system. Journal of Plankton Research. 32 (3), 285-303 (2010).
  28. Marcolin, C. R., Schultes, S., Jackson, G. A., Lopes, R. M. Plankton and seston size spectra estimated by the LOPC and ZooScan in the Abrolhos Bank ecosystem (SE Atlantic). Continental Shelf Research. 70, 74-87 (2013).
  29. Silva, N., Marcolin, C. R., Schwamborn, R. Using image analysis to assess the contributions of plankton and particles to tropical coastal ecosystems. Estuarine, Coast and Shelf Science. 219, 252-261 (2019).
  30. Vandromme, P., et al. Assessing biases in computing size spectra of automatically classified zooplankton from imaging systems: A case study with the ZooScan integrated system. Methods in Oceanography. 1-2, 3-21 (2012).
  31. Naito, A., et al. Surface zooplankton size and taxonomic composition in Bowdoin Fjord, north-western Greenland: A comparison of ZooScan, OPC and microscopic analyses. Polar Science. 19, 120-129 (2019).
  32. García-Comas, C., Picheral, E. Zooprocess/Plankton Identifier protocol for computer assisted zooplankton sorting. , Available from: https://manualzz.com/doc/43116355/zooprocess—plankton-identifier-protocol-for (2013).
  33. Picheral, E. ZooSCAN: Manual to scan and process samples. Quantitative Imaging Platform of Villefranche sur Mer (PlQv). , Available from: http://www.hydroptic.com/assets/uploads/files/documentations/ae4e0-zooscan_user_manual.pdf (2020).
  34. Protocolo de muestreo y laboratorio de fauna bentónica de invertebrados en ríos vadeables. CÓDIGO: ML-Rv-I-2013. Ministerio de Agricultura, Alimentación y Medio Ambiente. , Available from: https://www.miteco.gob.es/es/agua/temas/estado-y-calidad-de-las-aguas/ML-Rv-I-2013_Muestreo%20y%20laboratorio_Fauna%20bent%C3%B3nica%20de%20de%20invertebrado_%20R%C3%Ados%20vadeables_24_05_2013_tcm30-175284.pdf (2013).
  35. García-Comas, C., et al. Prey size diversity hinders biomass trophic transfer and predator size diversity promotes it in planktonic communities. Proceedings of the Royal Society Biological Sciences. 283 (1824), 20152129 (2016).
  36. García-Comas, C., et al. Mesozooplankton size structure in response to environmental conditions in the East China Sea: How much does size spectra theory fit empirical data of a dynamic coastal area. Progress in Oceanography. 121, 141-157 (2014).
  37. Marquina, D., Buczek, M., Ronquist, F., Lukasik, P. The effect of ethanol concentration on the morphological and molecular preservation of insects for biodiversity studies. PeerJ. 9, 10799 (2021).
  38. Bell, J. L., Hopcroft, R. R. Assessment of ZooImage as a tool for the classification of zooplankton. Journal of Plankton Research. 30 (12), 1351-1367 (2008).
  39. Colas, F., et al. The ZooCAM, a new in-flow imaging system for fast onboard counting, sizing and classification of fish eggs and metazooplankton. Progress in Oceanography. 166, 54-65 (2018).
  40. Bachiller, E., Fernandes, J. A., Irigoien, X. Improving semiautomated zooplankton classification using an internal control and different imaging devices. Limnology and Oceanography Methods. 10 (1), 1-9 (2012).

Tags

Ciencias Ambientales Número 191
Procesamiento automático de imágenes para determinar la estructura del tamaño de la comunidad de macroinvertebrados ribereños
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Gurí, R., Arranz, I., Ordeix,More

Gurí, R., Arranz, I., Ordeix, M., García-Comas, C. Automatic Image Processing to Determine the Community Size Structure of Riverine Macroinvertebrates. J. Vis. Exp. (191), e64320, doi:10.3791/64320 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter