Environment

Processamento Automático de Imagem para Determinar a Estrutura do Tamanho da Comunidade de Macroinvertebrados Ribeirinhos

Published: January 13, 2023 doi: 10.3791/64320

Rosa Gurí^1,4, Ignasi Arranz^2,4, Marc Ordeix^1,4, Carmen García-Comas^3,4

¹Center for the Study of Mediterranean Rivers (CERM), Universitat de Vic - Universitat Central de Catalunya, ²Laboratoire Evolution et Diversité Biologique (EDB), UMR5174, Université Toulouse 3 Paul Sabatier, Centre national de la recherche scientifique (CNRS), Institut de Recherche pour le Développement (IRD), ³Department of Marine Biology and Oceanography, Institut de Ciències del Mar, Consejo Superior de Investigaciones Científicas (CSIC), ⁴Aquatic Ecology Group, Universitat de Vic - Universitat Central de Catalunya

Summary

O artigo baseia-se na criação de um protocolo adaptado para escanear, detectar, classificar e identificar objetos digitalizados correspondentes a macroinvertebrados de rios bentônicos usando um procedimento de imagem semiautomático. Este procedimento permite a aquisição das distribuições de tamanho individual e métricas de tamanho de uma comunidade de macroinvertebrados em cerca de 1 h.

Abstract

O tamanho do corpo é um traço funcional importante que pode ser usado como um bioindicador para avaliar os impactos das perturbações nas comunidades naturais. A estrutura do tamanho da comunidade responde a gradientes bióticos e abióticos, incluindo perturbações antropogênicas entre táxons e ecossistemas. No entanto, a medição manual de organismos de corpo pequeno, como macroinvertebrados bentônicos (por exemplo, >500 μm a alguns centímetros de comprimento) é demorada. Para agilizar a estimativa da estrutura do tamanho da comunidade, desenvolvemos um protocolo para medir semi-automaticamente o tamanho corporal individual de macroinvertebrados de rios preservados, que são um dos bioindicadores mais comumente usados para avaliar o estado ecológico dos ecossistemas de água doce. Este protocolo é adaptado de uma metodologia existente desenvolvida para escanear o mesozooplâncton marinho com um sistema de varredura projetado para amostras de água. O protocolo consiste em três etapas principais: (1) varredura de subamostras (frações amostrais finas e grosseiras) de macroinvertebrados fluviais e processamento das imagens digitalizadas para individualizar cada objeto detectado em cada imagem; (2) criar, avaliar e validar um conjunto de aprendizagem através de inteligência artificial para separar semi-automaticamente as imagens individuais de macroinvertebrados de detritos e artefatos nas amostras digitalizadas; e (3) representando a estrutura de tamanho das comunidades de macroinvertebrados. Além do protocolo, este trabalho inclui os resultados da calibração e enumera vários desafios e recomendações para adaptar o procedimento a amostras de macroinvertebrados e considerar novas melhorias. No geral, os resultados apoiam o uso do sistema de varredura apresentado para a medição automática do tamanho corporal de macroinvertebrados fluviais e sugerem que a representação de seu espectro de tamanho é uma ferramenta valiosa para a rápida bioavaliação de ecossistemas de água doce.

Introduction

Os macroinvertebrados bentônicos são amplamente utilizados como bioindicadores para determinar o estado ecológico dos corpos d'água¹. A maioria dos índices para descrever comunidades de macroinvertebrados se concentra em métricas taxonômicas. No entanto, novas ferramentas de bioavaliação que integrem o tamanho corporal são encorajadas a fornecer uma perspectiva alternativa ou complementar às abordagens taxonômicas ^2,3.

O tamanho corporal é considerado um metatraço relacionado a outros traços vitais, como metabolismo, crescimento, respiração e movimento⁴. Além disso, o tamanho do corpo pode determinar a posição trófica e as interações⁵. A relação entre o tamanho corporal individual e a biomassa normalizada (ou abundância) por classe de tamanho em uma comunidade é definida como o espectro de tamanho⁶ e segue o padrão geral de uma diminuição linear da biomassa normalizada à medida que o tamanho individual aumenta em uma escala logarítmica⁷. A inclinação dessa relação linear tem sido extensivamente estudada teoricamente, e estudos empíricos em ecossistemas a têm utilizado como um indicador ecológico da estrutura de tamanho da comunidade⁴. Outro indicador sintético da estrutura de tamanho da comunidade que tem sido usado com sucesso em estudos de funcionamento da biodiversidade-ecossistema é a diversidade de tamanho da comunidade, que é representada como o índice de Shannon das classes de tamanho do espectro de tamanho ou seu analógico, que é calculado com base nas distribuições de tamanho individuais⁸.

Em ecossistemas de água doce, a estrutura de tamanho de diferentes grupos faunísticos é utilizada como indicador atáxico para avaliar a resposta de comunidades bióticas a gradientes ambientais 9,10,11 e a perturbações antrópicas 12,13,14,15,16. Os macroinvertebrados não são uma exceção, e sua estrutura de tamanho também responde a mudanças ambientais^17,18 e perturbações antropogênicas, como mineração ¹⁹, uso da terra 20 ou enriquecimento de nitrogênio (N) e fósforo (P)^20,21,22. No entanto, medir centenas de indivíduos para descrever a estrutura do tamanho da comunidade é uma tarefa tediosa e demorada que muitas vezes é evitada como uma medição de rotina em laboratórios devido à falta de tempo. Assim, vários métodos de imagem semiautomáticos ou automáticos para classificar e medir espécimes têm sido desenvolvidos^23,24,25,26. No entanto, a maioria desses métodos está focada na classificação taxonômica mais do que no tamanho individual dos organismos e não está pronta para uso em todos os tipos de macroinvertebrados. Na ecologia do plâncton marinho, um sistema de análise de imagens de varredura tem sido amplamente utilizado para determinar o tamanho e a composição taxonômica de comunidades de zooplâncton ^{27,28,29,30,31}. Este instrumento pode ser encontrado em vários institutos marinhos em todo o mundo, e é usado para digitalizar amostras de zooplâncton preservadas para obter imagens digitais de alta resolução de toda a amostra. O presente protocolo adapta o uso deste instrumento para estimar o tamanho do espectro da comunidade de macroinvertebrados em rios de forma rápida e automática, sem investir na criação de um novo dispositivo.

O protocolo consiste em digitalizar uma amostra e processar toda a imagem para obter automaticamente imagens únicas (ou seja, vinhetas) dos objetos na amostra. Várias medidas de forma, tamanho e características de nível de cinza caracterizam cada objeto e permitem a classificação automática dos objetos em categorias, que são então validadas por um especialista. O tamanho individual de cada organismo é calculado usando o biovolume elipsoidal (mm³), que é derivado da área do organismo medida em pixels. Isso permite obter o espectro de tamanho da amostra de maneira rápida. Até onde sabemos, este sistema de imagem de varredura só foi usado para processar amostras de mesozooplâncton, mas o dispositivo pode potencialmente permitir o trabalho com macroinvertebrados bentônicos de água doce.

O objetivo geral deste estudo é, portanto, introduzir um método para obter rapidamente o tamanho individual de macroinvertebrados fluviais preservados, adaptando um protocolo existente anteriormente utilizado com mesozooplâncton marinho 27,32,33. O procedimento consiste em usar uma abordagem semiautomática que opera com um dispositivo de digitalização para digitalizar amostras de água e três softwares abertos para processar as imagens digitalizadas. Um protocolo adaptado para digitalizar, detectar e identificar macroinvertebrados fluviais digitalizados para adquirir automaticamente a estrutura de tamanho da comunidade e as métricas de tamanho relacionadas é aqui apresentado. A avaliação do procedimento e as orientações para aumentar a eficiência também são apresentadas com base em 42 imagens digitalizadas de amostras de macroinvertebrados ribeirinhos coletadas de três bacias do Nordeste (NE) da Península Ibérica (Ter, Segre-Ebre e Besòs).

As amostras foram coletadas em trechos de rios de 100 m seguindo o protocolo de amostragem de campo e análise laboratorial de macroinvertebrados de rios bentônicos em rios transbordáveis do Governo Espanhol³⁴. As amostras foram coletadas com um amostrador de surber (quadro: 0,3 m x 0,3 m, malha: 250 μm) após um levantamento multi-habitat. No laboratório, as amostras foram limpas e peneiradas através de uma malha de 5 mm e 500 μm para obtenção de duas subamostras: uma subamostra grossa (malha de 5 mm) e uma subamostra fina (malha de 500 μm), que foram armazenadas em frascos separados e preservadas em etanol a 70%. Separar a amostra em duas frações de tamanho permite uma melhor estimativa da estrutura de tamanho da comunidade, uma vez que os organismos grandes são mais raros e menores do que os organismos pequenos. Caso contrário, a amostra digitalizada tem uma representação tendenciosa da fração de tamanho grande.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: O protocolo aqui descrito baseia-se no sistema desenvolvido por Gorsky et ^al.27 para o mesozooplâncton marinho. Uma descrição específica das etapas do scanner (ZooSCAN), do software de digitalização (VueScan 9x64 [9.5.09]), do software de processamento de imagens (Zooprocess, ImageJ) e do software de identificação automática (Plankton Identifier) pode ser encontrada nas referências anteriores^32,33. Para melhor ajustar os tamanhos dos macroinvertebrados bentônicos em relação ao mesozooplâncton, uma vez que o projeto é criado seguindo o protocolo original^32,33, altere o parâmetro de tamanho mínimo (minsizeesd_mm) para ^0,3 mm e o parâmetro de tamanho máximo (maxsizeesd_mm) para 100 mm no arquivo de configuração. Para ajudar a seguir o protocolo, isso é resumido em um gráfico de trabalho (Figura 1). O projeto criado é armazenado na pasta C do computador e é organizado nas seguintes pastas: PID_process, Zooscan_back, Zooscan_check, Zooscan_config, Zooscan_meta, Zooscan_results e Zooscan_scan. Cada pasta é composta de várias subpastas que os diferentes aplicativos de software usam nas etapas a seguir do protocolo.

1. Aquisição de imagens digitais para amostras de macroinvertebrados

Digitalizando e processando o espaço em branco
NOTA: Crie duas imagens em branco diariamente antes da digitalização para extrair as digitalizações de fundo enquanto processa as imagens digitalizadas no mesmo dia.
1. Ligue o scanner e ligue a luz na posição dupla para projetar a luz branca da parte superior e inferior.
  NOTA: Ao escanear amostras de mesozooplâncton, a direção da luz para cima é usada, mas como os macroinvertebrados são mais opacos, recomenda-se alternar a luz para uma posição dupla.
2. Limpe e lave a bandeja de digitalização com água da torneira.
3. Deite 110 ml de água da torneira armazenada à temperatura ambiente (RT) no tabuleiro de digitalização até que o vidro esteja coberto. Coloque o quadro grande (24,5 cm x 15,8 cm) na bandeja de digitalização na posição correta (com o canto na parte superior esquerda da bandeja de digitalização) e preencha-o com água da torneira até que o degrau do quadro seja coberto para evitar um efeito de menisco, o que alteraria a imagem digitalizada. Feche a tampa do scanner.
  NOTA: Use água no RT para evitar condensação e formação de bolhas. Limpe o quadro sem marcas ou gotículas para evitar a reflexão da luz.
4. Vá para o software de processamento de imagem, selecione o projeto de trabalho e clique em Digitalizar (Converter) Imagem de fundo.
5. Vá para o software de digitalização e clique em Preview. Certifique-se de visualizar a imagem digitalizada, verifique se não há linhas ou pontos e aguarde pelo menos 30 s antes de iniciar outra varredura. Clique em Digitalizar e pressione OK na janela de instruções antes da segunda digitalização para enviar os dados do software de digitalização para o software de processamento de imagem.
  Observação : varredura duas vezes para obter as duas varreduras em segundo plano que irão compor o espaço em branco. Essa etapa é feita uma vez por dia antes de iniciar o processamento da amostra e as imagens são armazenadas na pasta Zooscan_back.
6. Feche o software de digitalização depois de concluir a verificação.
Preparação e digitalização de amostras
CUIDADO: O etanol é um líquido inflamável e pode causar sérios danos / irritação ocular.
1. Preencha os metadados de exemplo. Vá para o software de processamento de imagem e selecione Preencher metadados de amostra. Insira a identidade do exemplo, clique em OK e preencha os metadados.
  NOTA: O metarquivo é criado especificamente para amostras de mesozooplâncton, portanto, ele não se encaixa na metodologia de amostragem de macroinvertebrados bentônicos, mas todos os campos do arquivo precisam ser preenchidos antes da varredura ou um sinalizador de erro aparecerá.
2. Despeje 110 mL de etanol a 70% na bandeja de digitalização até que o vidro esteja coberto e coloque a estrutura grande (24,5 cm x 15,8 cm) com o canto na parte superior esquerda da bandeja de digitalização.
  NOTA: Trabalhe com etanol em vez de água, pois os macroinvertebrados são preservados em etanol. Na água, eles flutuam e flutuam na bandeja de digitalização, impedindo uma imagem nítida e, portanto, medições de tamanho confiáveis. O etanol deve ser preservado no RT para evitar condensação e formação de bolhas.
3. Despeje a amostra de macroinvertebrados na bandeja de varredura bordada pelo quadro e cubra a etapa do quadro com mais etanol, se necessário.
  NOTA: Abster-se de adicionar muito etanol para evitar que os organismos flutuem e fiquem à deriva.
4. Homogeneize a amostra em toda a área do quadro, colocando os maiores indivíduos no centro da bandeja para o processamento adequado da imagem, e afunde os organismos flutuantes usando uma agulha de madeira.
  NOTA: Se uma subamostra contiver numericamente mais de 1.000 indivíduos, divida a subamostra em duas ou mais frações para minimizar o toque de organismos na imagem digitalizada e digitalize as frações separadamente.
5. Separe os organismos que tocam e os organismos que tocam as bordas da estrutura usando a agulha de madeira.
  NOTA: Este passo requer 5-20 min. Os organismos tocantes são considerados um único objeto pelo software; assim, nesses casos, os tamanhos individuais calculados não correspondem a organismos únicos reais e podem enviesar a estimativa da estrutura de tamanho da comunidade. Existe a possibilidade de editar a imagem com o software de processamento de imagem para separá-las, mas essa etapa adicional envolve pelo menos 1,5 h de reprocessamento; portanto, a separação manual é altamente recomendada.
6. Para digitalizar a amostra, feche a tampa do scanner, vá para o software de processamento de imagem, selecione o projeto de trabalho e clique em SCAN Sample with Zooscan (For Archive, No Process).
7. Selecione a amostra e siga as instruções.
8. Vá para o software de digitalização e clique em Preview. Certifique-se de visualizar a imagem digitalizada, verifique se não há linhas ou pontos e aguarde pelo menos 30 s antes de iniciar outra varredura.
9. Após pelo menos 30 s, clique no botão Digitalizar no software de digitalização.
  NOTA: Pressione OK no software de processamento de imagem depois de pressionar Digitalizar no software de digitalização. Não pressione nenhuma tecla no teclado do computador e evite vibrações da varredura durante a digitalização. Três arquivos são gerados na pasta Zooscan_scan > _raw : (i) um formato de arquivo de imagem marcado (.tif) (16 bits); (ii) um documento de texto padrão chamado LOG (.txt) que registra informações sobre os parâmetros de digitalização; e (iii) um documento de texto padrão denominado META (.txt) com informações sobre os métodos de amostragem.
10. Verifique se a varredura bruta está correta.
  Observação : se a varredura tiver listras de luz ou outros problemas visíveis, considere repetir a varredura para evitar problemas nas etapas a seguir.
Recuperação de amostra
1. Remova o quadro e enxágue-o acima da bandeja de digitalização usando um frasco de compressão cheio de etanol a 70% para recuperar quaisquer macroinvertebrados ligados.
2. Levante a parte superior do scanner para recuperar todos os organismos e etanol da bandeja através do funil de recuperação de varredura em um copo. Com a parte superior do scanner ainda levantada, lave a bandeja com o frasco de aperto para varrer os organismos restantes.
3. Passe os espécimes e o etanol do copo através de uma malha de 500 μm para reter os invertebrados na malha e guarde-os novamente em um frasco para injetáveis com etanol a 70%.
4. Uma vez que todos os espécimes estejam recuperados no frasco para injetáveis, limpe a bandeja com água da torneira.
  NOTA: Lave a bandeja com água da torneira entre as amostras para minimizar a precipitação de etanol, o que altera o processamento da imagem. Lave o quadro com água da torneira para evitar possíveis danos relacionados ao uso de etanol. No final do dia, limpe a bandeja usando água da torneira e seque-a suavemente com papel para evitar arranhões.
Processamento de imagens
1. Vá para o software de processamento de imagem e selecione CONVERTER e PROCESSAR Imagens e Organismos no Modo de Lote e, em seguida, Converter E Processar Imagem E Partículas (Imagem na Pasta RAW). Mantenha as configurações padrão e clique em OK. NORMAL END aparecerá no final do processo.
  OBSERVAÇÃO: Um arquivo PID e as vinhetas correspondentes a todos os objetos detectados na imagem digitalizada (em um arquivo de Grupo Fotográfico Conjunto [.jpg]) serão criados na pasta Zooscan_scan > _work. Um arquivo PID é um único arquivo que armazena todos os metadados (metarquivo), os dados técnicos associados ao arquivo de log e uma tabela com 36 variáveis medidas de todos os objetos detectados na imagem. As variáveis medidas correspondem a diferentes estimativas de nível de cinza, dimensão fractal, forma e tamanho. As variáveis que podem ser usadas para estimativa de tamanho são a área e os eixos maior e menor de uma elipse com uma área igual ao objeto (ver seção 3 do protocolo). O tempo de processamento depende da densidade da imagem e das características do computador, e pode ser iniciado entre as amostras durante a recuperação e preparação da próxima amostra. Caso contrário, recomenda-se iniciar o processamento das amostras digitalizadas todos os dias no modo de lote durante a noite e verificar se há processamento de imagem adequado na manhã seguinte.
2. Verifique se o plano de fundo na imagem processada é adequadamente subtraído da imagem de amostra usando o software de processamento de imagem ou verificando as imagens de máscara (terminadas em msk1.gif) localizadas em Zooscan_scan > _work. Se o plano de fundo contiver áreas saturadas ou muitos pontos, considere repetir a varredura para garantir imagens de alta qualidade.
  NOTA: Para evitar áreas saturadas no fundo, a bandeja de digitalização deve ser enxaguada com água da torneira após cada varredura com etanol. Também é importante (1) reduzir o número de indivíduos escaneados (fracionando a amostra e digitalizando em diferentes dobras); (2) garantir que os grandes organismos sejam colocados no centro da bandeja de digitalização; (3) usar etanol limpo e filtrado; (4) reduzir a sujeira nas amostras; (5) assegurar que o volume de etanol para a varredura seja adequado; e (6) garantir que o atraso entre a visualização da amostra e a varredura seja de pelo menos 30 s.
Separação de organismos tocantes
NOTA: Quando há várias vinhetas com organismos tocantes, é necessário separar as imagens dos organismos tocantes de outros organismos e/ou de fibras/detritos para garantir uma estimativa adequada da estrutura do tamanho da comunidade.
1. Vá para o software de processamento de imagem para detectar as vinhetas com vários objetos. Selecione SEPARAÇÃO Usando Vinhetas e pressione OK. Na janela de seleção de configuração, mantenha as configurações padrão e clique em OK.
2. Na janela SEPARAÇÃO de VINHETAS , mantenha as configurações padrão, selecione adicionalmente ADICIONAR Contornos em Vinhetas e, em seguida, selecione o exemplo a ser editado.
3. Separe os organismos que tocam em cada vinheta que aparece desenhando uma linha com o mouse (pressione o botão de rolo para desenhar). Quando a separação em uma vinheta estiver concluída, clique no botão X no canto superior direito da janela e pressione SIM para processar a próxima. Pressione NÃO para terminar e salvar as alterações. No final do processo, NORMAL END aparecerá se tudo estiver correto.
4. Após a separação, reprocesse a imagem para obter os dados de objeto atualizados. Vá para o software de processamento de imagem, clique em PROCESS (Converted) Image (Process One) e selecione Process Again Particles from Processed Images in WORK Sub-Folders. Selecione o exemplo e, na janela Processo de Imagem Única , mantenha as configurações padrão, marque Trabalhar com Máscara de Separação (CREATE-MODIFY-INCLUDE) e clique em OK. No final do processo, NORMAL END aparecerá se tudo estiver correto.
5. Na janela Controle de Separação , pressione OK para salvar a imagem com os contornos antes do processamento; se uma imagem anterior existir, ela será substituída.
6. Na janela Máscara de Controle de Separação , se necessário, selecione EDITAR para adicionar linhas de separação à máscara usando o mouse para separar os organismos que tocam que não apareceram antes na etapa de separação usando vinhetas. Quando terminar, encerre o processo e, na janela Controle de Máscara de Separação , selecione SIM para aceitar a máscara. No final do processo, NORMAL END aparecerá se tudo estiver correto.
  NOTA: O reprocessamento de uma amostra com uma máscara de separação é demorado (isso pode levar mais de 1,5 h por amostra). É preferível dedicar o tempo necessário na etapa 1.2.5 para evitar essa etapa adicional.

2. Reconhecimento automático dos objetos

NOTA: Crie um conjunto de aprendizagem para prever automaticamente a identidade dos objetos detectados, separando assim os organismos dos detritos na amostra.

Criação de conjunto de aprendizagem
1. Copie as imagens e os arquivos .pid associados às imagens que serão usadas para criar as categorias do conjunto de aprendizado de Zooscan_scan > _work para PID_process > Unsorted_vignettes_pid.
  NOTA: Seleccione um subconjunto de amostras com elevada diversidade de táxons e diferentes locais de amostragem e/ou épocas de amostragem para garantir a máxima representatividade dos organismos nas amostras.
2. Na pasta PID_process > conjunto de aprendizado, crie uma subpasta com o nome do novo conjunto de aprendizado (ou seja, yyyymmdd_raw_LS) e, dentro dela, crie as subpastas que corresponderão a cada categoria do conjunto de aprendizado (ou seja, macroinvertebrados, detritos, outros invertebrados).
  NOTA: Para obter de forma eficiente a estrutura de tamanho da comunidade de amostras de macroinvertebrados de rios, recomenda-se usar um conjunto de aprendizado baseado em apenas três categorias: macroinvertebrados, outros invertebrados e detritos. Esse conjunto de aprendizado basicamente separa as vinhetas de objetos correspondentes a organismos daquelas correspondentes a detritos (por exemplo, fibras, partículas ou algas filamentosas).
3. Vá para o software de processamento de imagem (somente modo Avançado) e escolha Vinhetas EXTRACT para PLANKTON IDENTIFIER (vinhetas não classificadas para treinamento). Mantenha as opções padrão e marque a caixa Adicionar Contornos .
4. Vá para o software de identificação automática, clique em Aprendizagem, selecione PID_process > Learning_set a subpasta criada para o novo conjunto de aprendizagem (etapa 2.1.2) e pressione OK.
5. Na seção esquerda (Unsorted Thumbs) da janela aberta, selecione a pasta Unsorted vignettes_pid. Selecione as vinhetas e arraste-as com o mouse dos polegares não classificados para a pasta de sua categoria correspondente na seção direita, Polegares Classificados, para classificar cada objeto nas categorias definidas. As vinhetas movidas serão marcadas com um X vermelho.
  Observação : defina as categorias manualmente criando subpastas na pasta polegares classificados ou crie-as clicando no ícone de pastas no software. Não mova mais de 50 vinhetas ao mesmo tempo.
6. Depois que todas as categorias forem concluídas com os objetos selecionados (cerca de 300 objetos por categoria), clique em Criar arquivo de aprendizado e salve-o com o nome desejado.
  Observação : O conjunto de aprendizado será salvo como um arquivo .pid na pasta PID_process > conjunto de aprendizado do projeto. Recomenda-se criar e testar vários conjuntos de aprendizagem com diferentes níveis de categorias (de formas grosseiras a finas) e com um equilíbrio diferente do número de objetos dentro de cada categoria. Comece com um conjunto de aprendizado grosseiro com um número baixo de categorias e pelo menos 50 objetos por categoria e, em seguida, aumente o número de objetos em cada categoria e/ou crie conjuntos de aprendizado mais refinados. Uma categoria deve ser representativa de sua variabilidade no conjunto de amostras.
Avaliação do conjunto de aprendizagem
NOTA: Execute a validação cruzada com duas dobras e cinco ensaios usando o método Random Forest com o software de identificação automática para obter uma matriz de confusão da classificação resultante dos objetos.
1. Vá para o software de classificação automática e clique em Análise de Dados.
2. Em Selecionar arquivo de aprendizado, selecione o arquivo de conjunto de aprendizado criado PID_process > conjunto de aprendizado.
3. Em Selecionar um método, escolha o método Floresta aleatória de validação cruzada. Em Variáveis Originais, desmarque as variáveis de posição (X, Y, XM, YM, BX, BY e Altura). Em Variáveis Personalizadas, marque somente ESD.
  Observação : esse método usa uma parte aleatória do conjunto de aprendizado para reconhecer a outra parte (duas vezes), e isso é repetido cinco vezes para garantir que seja estatisticamente robusto.
4. Clique em Iniciar análise e salve os resultados como Analysis_name.txt na pasta Previsão PID_process >. Quando a análise tiver sido concluída com êxito, encerre a análise de dados.
5. Vá para a pasta PID_process > Prediction e clique no arquivo de validação cruzada. Uma janela aparecerá com a matriz de confusão da classificação verdadeira (linhas) versus a classificação automática (colunas).
  NOTA: A recordação é a porcentagem de organismos pertencentes a um grupo que foi automaticamente bem reconhecido, enquanto 1-precisão é a porcentagem de organismos classificados pelo algoritmo como um grupo que não é reconhecido (contaminação em um grupo). O recall deve ser superior a 70% e a contaminação (precisão 1) deve ser inferior a 20%.
6. Repita as etapas 2.1-2.5 se vários conjuntos de aprendizagem foram criados e a recordação e a precisão 1 de cada um precisam ser obtidas.
  NOTA: Se vários conjuntos de aprendizagem tiverem sido criados, escolha aquele com maior recordação (bom reconhecimento) e precisão (baixa contaminação) do grupo de interesse (ou seja, macroinvertebrados) para testar a previsão automática de um conjunto de amostras na próxima etapa.
Predição da identificação de macroinvertebrados
Observação : use o conjunto de aprendizado selecionado para prever a identidade de todos os objetos em um subconjunto de amostras usando o software de identificação automática com um algoritmo de floresta aleatória.
1. Vá para o software de identificação automática e clique em Análise de Dados.
2. Em Selecionar arquivo de aprendizado, selecione o arquivo de conjunto de aprendizado PID_process > conjunto de aprendizado que deve ser usado para a previsão.
3. Em Selecionar arquivo(s) de exemplo, selecione na pasta PID_results as amostras (arquivos PID) que serão previstas.
  Observação : processar um máximo de 20 arquivos .pid ao mesmo tempo para evitar erros relacionados a problemas de memória. Se muitos arquivos .pid forem processados ao mesmo tempo, o processo mostrará um final correto, mas pode não ser bem processado, e um erro pode ocorrer nas próximas etapas ao processar com o software de processamento de imagem.
4. Em Select a Method, escolha o método Random Forest . Marque Salvar resultados detalhados para cada amostra. Em Variáveis Originais, desmarque as variáveis de posição (X, Y, XM, YM, BX, BY e Altura). Em Variáveis Personalizadas, marque somente ESD.
5. Clique em Iniciar análise e salve os resultados como Analysis_name.txt na pasta Previsão PID_process >.
Validação manual
Observação : um especialista valida manualmente a previsão da etapa anterior para reclassificar objetos classificados incorretamente na categoria correta.
1. Copie os arquivos Analysis_sample_dat1.txt a serem validados da pasta Previsão do PID_process > para a pasta PID_process > Pid_results.
2. Vá para o software de processamento de imagem e selecione Vinhetas EXTRACT em Pastas de acordo com PREVISÃO ou VALIDAÇÃO. Em seguida, selecione Usar arquivos previstos da pasta "pid_results". Mantenha as configurações padrão e pressione OK.
3. O software cria uma pasta chamada sample_yyyymmdd_hhmm_to_validate com os objetos previstos na pasta PID_process > vinhetas classificadas.
4. Vá para a pasta PID_process > Vinhetas Ordenadas e copie a pasta sample_yyyymmdd_ hhmm_to_validate. Substitua o nome da pasta _to validar por _validated.
5. Para validar manualmente a classificação automática, abra a pasta sample_yyyymmdd_ hhmm_validated e revise todas as vinhetas de cada subpasta (categoria) para identificar se há objetos classificados incorretamente. Quando um objeto for classificado incorretamente, arraste a vinheta usando o mouse para a pasta (categoria) correta.
6. Vá para o software de processamento de imagem e selecione LOAD Identifications from Sorted Vignettes. Mantenha as configurações padrão e selecione yyyymmdd_hhmm_name_validated a serem processadas.
7. Vá para PID_process > Pid_results > Dat1_validated, onde um arquivo chamado Id_from_sorted_vignettes_yyyymmdd_hhmm.txt e um arquivo .txt para cada uma das amostras validadas (sample_tot_1_dat1.txt) foram criados.
  Observação : esses arquivos de .txt contêm uma nova coluna que apresenta a previsão, chamada pred_valid_Id_yyyymmdd_hhmm, que especifica a classificação de especialista de cada objeto (ou seja, a classificação validada). Novas categorias (por exemplo, categorias taxonômicas mais finas) poderiam ser criadas neste ponto, durante a validação. No entanto, mantenha o nome da categoria original no novo nome (por exemplo, macroinvertebrate_chironomidae). Isso permite refazer a categoria original ao calcular a recordação e a precisão e agrupar facilmente todos os macroinvertebrados para calcular os parâmetros da estrutura do tamanho da comunidade (ou seja, o espectro de tamanho e a diversidade de tamanho). O arquivo de texto fornece os dados associados a cada objeto, incluindo os eixos menor e maior que são usados para obter o volume elipsoidal de cada organismo como uma medida do tamanho do corpo individual. Além disso, as duas últimas colunas da tabela contêm as categorias previstas e validadas de cada objeto (linha), que permitem calcular, por categoria, a recordação e a precisão do conjunto de aprendizagem no subconjunto de amostras.

Figura 1: Gráfico de trabalho representando a seção 1 e a seção 2 do protocolo. Os tempos são ilustrativos e podem mudar dependendo do computador, da abundância de vinhetas para processar e do número de categorias do conjunto de aprendizado. Este caso corresponde à validação de um conjunto de aprendizagem de três categorias em um conjunto de 42 subamostras (no total, 47.473 vinhetas). Por favor, clique aqui para ver uma versão maior desta figura.

3. Calculando a distribuição de tamanho individual, espectros de tamanho e métricas de tamanho

Observação : os cálculos mencionados nesta seção foram executados usando o Matlab (consulte o script como arquivo suplementar 1).

Distribuição de tamanho individual
1. A última coluna do arquivo Id_from_sorted_vignettes_YYYYMMDD_HHHH.txt contém a classificação validada dos objetos. Selecione apenas os objetos classificados como macroinvertebrados para representar sua distribuição de tamanho individual na amostra.
  NOTA: O tamanho individual do corpo corresponde ao volume elipsoidal dos organismos macroinvertebrados. O sistema fornece medições em pixels.
2. Concatene os vetores com as medidas de tamanho de ambas as varreduras, porque cada fração tem um expoente de subamostragem diferente. Antes da concatenação, corrija o fracionamento replicando os vetores de tamanho quantas vezes a subamostra correspondente tiver sido fracionada.
  NOTA: Esta etapa é necessária se uma varredura corresponder a uma fração de uma amostra (ou seja, grossa ou fina).
3. Calcule o volume elipsoidal a partir dos eixos maior (M) e menor (m) dos elipsoides prolatos com as mesmas áreas de pixel que os organismos. Antes de calcular o volume elipsoidal, converta os eixos maior (M) e menor (m) de pixels para milímetros (mm) com o seguinte fator de conversão (cf):
  1 pixel = 2.400 dpi
  1 pol = 25,4 mm
  cf = 25,4/2400
  O volume elipsoidal (elipse com unidades em mm³) corresponde a:
4. Descreva a função densidade de probabilidade da distribuição de tamanho individual na escala log₂ .
Diversidade de tamanho
1. Calcule a diversidade de tamanho (Sd) seguindo Quintana et al. (2008)⁸, como em García-Comas et al. (2016)³⁵:
  
  onde p x(x) é a função de densidade de probabilidade do tamanho x, e _x representa o log₂(ellipVol). Esta medida é, portanto, o índice de diversidade de Shannon adaptado a uma medida contínua, como a distribuição de tamanho individual em uma comunidade.
Espectro de tamanho de biovolume normalizado (NBSS)
1. Definir as classes de tamanho do NBSS, estabelecendo o limite inferior do espectro como o quantil 0,01 da distribuição de tamanho dos macroinvertebrados nas amostras e criando classes de tamanho por uma escala geométrica de base 2 até que o maior organismo nas amostras seja englobado.
  Observação : A largura da classe de tamanho aumenta com o tamanho para levar em conta a maior variabilidade associada a tamanhos maiores. O NBSS das comunidades de macroinvertebrados aqui analisadas apresentou 14 classes de tamanho (Tabela 1).
2. Obter o biovolume normalizado dividindo o biovolume total em cada classe de tamanho pela largura da classe de tamanho.
Inclinação do espectro de tamanho
1. Calcule a inclinação linear do NBSS.
  NOTA: A inclinação (μ) é calculada com base na relação entre o log 2 (ponto médio da classe de tamanho) e o log₂(biomassa normalizada) nas classes de tamanho maiores que o modo, ignorando quaisquer vazias (neste estudo, as classes de tamanho de 3 a 14).

Limites de classe de tamanho (mm³)	Ponto médio da classe de tamanho (mm³)
0,1236	0,1855
0,2473	0,3709
0,4946	0,7418
0,9891	1,4837
1,9783	1,4837
3,9560	5,9348
7,9131	11,8696
15,8261	23,7392
31,6522	47,4783
63,3044	94,9567
126,6089	189,9133
253,2178	379,8267
506,4300	7597,7000
1012,9000	15193,0000
2025,7000

Tabela 1: Classes de tamanho do espectro de tamanho de biomassa normalizado (NBSS). A tabela também mostra os limites de classe de tamanho 15 e os pontos médios da classe de tamanho dos organismos.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Aquisição de imagens digitais de amostras de macroinvertebrados
Nuances de varredura: Deposição de etanol na bandeja de varredura
Ao testar o sistema para macroinvertebrados, vários exames foram de baixa qualidade. Uma área saturada escura no fundo impediu o processamento normal da imagem e a medição dos tamanhos individuais dos macroinvertebrados (Figura 2). Várias razões foram dadas para o aparecimento de áreas saturadas no fundo ou imagens altamente pixeladas: (1) a presença de muitos organismos na bandeja de digitalização; (2) a presença de sujeira nas amostras; (3) um atraso insuficiente entre a pré-visualização da amostra e a sua digitalização; ou (4) utilizar no processamento da imagem uma imagem de fundo de má qualidade devido à condensação, sujeira ou má qualidade da água³³. Em amostras de comunidades de macroinvertebrados, o uso de etanol em vez de água causa precipitação na bandeja, que forma uma sombra escura se não for devidamente enxaguada com água entre os exames. Isso é vital para obter imagens nítidas e minimizar qualquer corrosão relacionada do vidro da bandeja de digitalização.

Nuances de varredura: concentração de detritos
A partir da análise de um subconjunto de 47.473 vinhetas, uma alta porcentagem (86,1%) correspondeu a detritos, incluindo detritos, fibras ou partes do corpo (como pernas ou brânquias), ou artefatos de varredura (Figura 3A-E). Os organismos invertebrados corresponderam aos 13,9% restantes dos objetos detectados (Figura 3F-L). Assim, apesar da separação meticulosa anterior de organismos da matéria orgânica em laboratório, muitos pequenos detritos ainda permaneciam no frasco.

Nuances de digitalização: Tocando objetos
A presença significativa de detritos potencializa o toque entre os organismos e, portanto, a criação de vinhetas com agregados que incluem múltiplos organismos tocantes e organismos ligados a partículas ou fibras (Figura 4A-C). Essas vinhetas são uma fonte de viés na determinação da forma da estrutura de tamanho individual. Em um conjunto de cinco amostras (11 subamostras), de todas as vinhetas com macroinvertebrados, 10% corresponderam a grupos com organismos tocantes ou organismos tocando partículas ou fibras. Essas vinhetas foram editadas com o programa de processamento de imagens, a fim de separar os organismos tocantes e os organismos com partículas anexadas. O reprocessamento das amostras com a máscara de separação envolveu a criação de novas vinhetas com os objetos recém-separados, que foram validadas para garantir sua classificação adequada.

Reconhecimento automático dos objetos
Resultados do conjunto de aprendizagem
Um conjunto de aprendizagem é um conjunto de vinhetas de objetos classificados em diferentes categorias por um especialista e utilizados em um modelo de aprendizagem supervisionada, e isso também pode ser chamado de conjunto de treinamento²⁷. É possível trabalhar com um conjunto de aprendizagem existente, atualizar o conjunto de aprendizagem existente com novas vinhetas e / ou categorias, ou criar um novo conjunto de aprendizagem para um projeto específico.

Para determinar o melhor conjunto de aprendizagem para obter rapidamente a estrutura de tamanho de macroinvertebrados, vários conjuntos de aprendizagem foram criados e testados através de validação cruzada com o algoritmo Random Forest. A matriz de confusão resultante mostra a classificação verdadeira (linhas) versus a classificação automática (colunas). O recordatório é a porcentagem de organismos pertencentes a uma categoria que foi automaticamente bem classificada, enquanto a precisão 1 é a porcentagem de organismos classificados erroneamente pelo algoritmo como pertencentes a uma categoria (contaminação em uma categoria)³³. Como regra geral, o recall deve estar acima de 70%, e a contaminação (precisão 1) deve ser inferior a 20% para manter uma categoria no conjunto de aprendizado. O conjunto de aprendizagem com a maior recordação e precisão para macroinvertebrados é então validado com um subconjunto de amostras para determinar sua real precisão na identificação de macroinvertebrados.

Foram testados três tipos de conjuntos de aprendizagem atáxica (crua, intermediária e fina) com categorias baseadas nas características morfológicas dos objetos. O conjunto de aprendizado bruto incluiu três categorias: macroinvertebrados, outros invertebrados (microcrustáceos) e detritos (fibras, partículas e artefatos como manchas de vidro). O conjunto de aprendizagem intermediária incluiu 16 categorias: 5 para macroinvertebrados, 3 para outros invertebrados e 8 para detritos. O conjunto de aprendizagem fina incluiu mais 4 categorias de macroinvertebrados, com um total de 20 categorias (Tabela 2).

Além da definição das categorias, também foi testado o efeito do número de vinhetas por categoria. Cada conjunto de aprendizagem foi testado separadamente usando 50 vinhetas, 100 vinhetas e 300 vinhetas em cada categoria (e 500 vinhetas para o conjunto de aprendizagem bruto com três categorias). Todas as categorias foram equilibradas em número, exceto "Ostracoda", "macroinvertebrados de longa rodada" e "macroinvertebrados de concha redonda", que incluíram menos indivíduos nos conjuntos de aprendizagem de 100 vinhetas e 300 vinhetas porque não foram detectados organismos suficientes dessas categorias nas imagens digitalizadas.

A recordação e a precisão para macroinvertebrados (todas as categorias de macroinverebrate juntas) e organismos (as categorias de macroinvertebrados e outros invertebrados juntas) foram consideradas para selecionar o melhor conjunto de aprendizagem por validação cruzada (ver as tabelas no Arquivo Suplementar 2). O melhor conjunto de aprendizagem foi o conjunto de aprendizagem bruta com três categorias (macroinvertebrados, outros invertebrados e detritos), com 300 objetos em cada categoria (Tabela 2). O conjunto de aprendizagem bruto foi posteriormente utilizado para validar a classificação automática dos objetos no subconjunto de amostras digitalizadas.

Conjunto de aprendizagem	Número de categorias	Imagens por categoria	Organismos de Recordação	Recordar macro-invertebrados	1-organismos de precisão	Macroinvertebrados de 1 precisão
Cru	3	50	0.97	0.84	0.12	0.24
		100	0.96	0.87	0.06	0.17
		300	0.95	0.91	0.09	0.15
		500	0.93	0.88	0.13	0.2
Média	16	50	0.83	0.77	0.17	0.24
		100	0.84	0.79	0.15	0.21
		300	0.87	0.84	0.14	0.18
Multa	20	50	0.89	0.86	0.14	0.18
		100	0.9	0.87	0.11	0.14
		300	0.9	0.86	0.13	0.14

Tabela 2: Conjuntos de aprendizagem criados e testados (brutos, intermediários e finos) com as categorias dentro de cada um e o número de objetos por categoria. Recordação e 1-precisão dos conjuntos de aprendizagem criados. Categorias do conjunto de aprendizagem Raw: Macroinvertebrados (1), Outros invertebrados (2), Detritos (3). Categorias do conjunto de aprendizagem Médio: Macroinvertebrados longos (1), Macroinvertebrados longos e lisos (2), Macroinvertebrados longos espetados (3), Macroinvertebrados redondos (4), Macroinvertebrados de concha redonda (5), Cladocera (6), Copepoda (7), Ostracoda (8), Agregados (9), Fibras (10), Cabeças (11), Pernas (12), Manchas (13), Manchas escuras (14), Manchas cinzentas claras (15), Manchas redondas (16). categorias do conjunto de aprendizagem Fine : Macroinvertebrados longos (1), Macroinvertebrados longos e lisos (2), Macroinvertebrados escuros longos e lisos (3), Macroinvertebrados longos redondos (4), Macroinvertebrados longos espetados (5), Macroinvertebrados redondos (6), Macroinvertebrados de concha redonda (7), Macroinvertebrados escuros redondos (8), Macroinvertebrados de concha redonda (9), Cladocera (10), Copepoda (11), Ostracoda (12), Agregados (13), Fibras (14), Cabeças (15), Pernas (16), Manchas (17), Manchas escuras (18), manchas cinzentas claras (19), Manchas redondas (20).

Validação do reconhecimento automático com o melhor conjunto de aprendizagem
Os objetos em um subconjunto de 42 subamostras finas e grosseiras foram automaticamente classificados pelo conjunto de aprendizagem selecionado com o algoritmo Random Forest. Após a validação manual, a recordação para todas as categorias foi alta (em média, 0,94 para macroinvertebrados, 0,95 para outros invertebrados e 0,92 para detritos), enquanto a contaminação (precisão 1) foi bastante baixa, com exceção de outros invertebrados (0,25 para macroinvertebrados, 0,84 para outros macroinvertebrados e 0,01 para detritos) (Figura 5 ). Outros invertebrados (microcrustáceos) foram raros nas amostras (presentes em 17 das 42 subamostras); assim, a comparação não foi robusta. Além disso, esta categoria foi altamente afetada pela contaminação devido à semelhança na forma e nos níveis de cinza com outros objetos.

A comparação da abundância automática versus validada de macroinvertebrados mostrou que estes foram altamente correlacionados (r de Pearson = 0,92, p-valor < 0,0001, n = 24 para subamostras grosseiras; R de Pearson = 0,98, p-valor < 0,0001, n = 18 para subamostras finas), com discreta superestimação pelo desempenho automático devido à contaminação por detritos (declives < 1) (Figura 6). Em relação à comparação do volume elipsoidal médio, a correlação também foi alta (r de Pearson = 0,96, p-valor < 0,0001, n = 24 para amostras grossas; R de Pearson = 0,99, valor de p < 0,0001, n = 18 para amostras finas), e a inclinação do espectro de tamanho foi próxima de −1 (Figura 6). A diferença nas inclinações entre as frações fina e grossa reflete o maior efeito do erro de classificação nas frações de grande porte, o que está relacionado à baixa contagem de organismos.

As funções de densidade de probabilidade das distribuições de tamanho individuais da predição automática concordaram fortemente com as previsões validadas para as subamostras finas, bem como para as subamostras grosseiras. No entanto, houve algumas exceções para as subamostras grosseiras relacionadas ao número de organismos e, portanto, maior efeito de classificação incorreta nesses casos, como destacado anteriormente (Figura 7).

Efeito do toque de organismos nas distribuições de tamanho individuais, espectros de tamanho e métricas de tamanho
Uma comparação das distribuições de tamanho obtidas antes e após a separação dos organismos tocantes e antes da validação em um subconjunto de cinco amostras selecionadas foi realizada para avaliar o efeito dos objetos tocantes. Para comparar as distribuições de tamanho, as subamostras grossas e finas foram combinadas, de acordo com seu fracionamento, para reconstruir uma amostra representando a comunidade de macroinvertebrados. Em três amostras, a abundância após validação aumentou (>500 indivíduos) (Figura 8A). Apesar desse aumento, o volume elipsoidal médio se aproximou muito do calculado nas amostras validadas (Figura 8B).

As distribuições de tamanho das amostras corrigidas (após a separação dos organismos tocantes) diferiram ligeiramente das validadas. Assim, a presença de múltiplos objetos teve pequena influência nas distribuições de tamanho nessas amostras (Figura 9A-E). Nesse sentido, a diversidade de tamanho calculada com base nas amostras corrigidas correlacionou-se fortemente com a diversidade de tamanho das validadas (r de Pearson = 0,94, p-valor = 0,017, n = 5) (Figura 9F).

Teoricamente, o espectro de tamanho de biovolume normalizado (NBSS) de uma comunidade com vários níveis tróficos tem uma inclinação do espectro de tamanho na escala log₂ que se aproxima de -1 em condições de estado estacionário⁴. O NBSS em comunidades naturais muitas vezes tem um inchaço em vez de uma distribuição linear, e isso é atribuído principalmente ao viés de amostragem das classes de tamanho menores³⁶. No presente estudo, a terceira classe de tamanho foi a mais comum no NBSS.

Os NBSSs foram bastante semelhantes entre as etapas do protocolo (Figura 10A-C), com exceção de algumas classes de tamanho em alguns espectros (Figura 10D-E). Nesse sentido, a inclinação do espectro de tamanho calculada com base nas amostras corrigidas correlacionou-se fortemente com a inclinação baseada nas validadas (r de Pearson = 0,99, p-valor ≤ 0,0001, n = 5) (Figura 10F).

Figura 2: Exemplos de imagens digitalizadas com diferentes qualidades antes e depois de serem processadas. (A,B) Imagem bruta (esquerda) e imagem processada (direita) de uma subamostra fina com boa qualidade de digitalização; (C,D) Imagem bruta (esquerda) e imagem processada (direita) de uma subamostra fina com má qualidade de digitalização (fundo escuro e imagem cortada na borda esquerda); (E,F) imagem bruta (esquerda) e imagem processada (direita) de uma subamostra fina com má qualidade de digitalização (fundo escuro muito pixelado). Por favor, clique aqui para ver uma versão maior desta figura.

Figura 3: Vinhetas de contorno representando diferentes objetos presentes nas amostras. (A-E) Detritos (fibra, coloração redonda, perna de macroinvertebrados, manchas e detritos orgânicos); (F-I) macroinvertebrados (Coleoptera, Diptera, Plecoptera e Trichoptera) e (J-L) outros invertebrados (Cladocera, Copepoda e Ostracoda). As barras de escala indicam 1 mm gma = 1,1. Por favor, clique aqui para ver uma versão maior desta figura.

Figura 4: Exemplos de vinhetas contendo múltiplos objetos. (A) Um macroinvertebrado (Hydracarina) ligado a uma fibra; (B) múltiplos organismos (Caenidae) agregados por uma fibra; e (C) dois macroinvertebrados tocantes (Chironomidae e Caenidae). As barras de escala indicam 1 mm gma = 1,1. Por favor, clique aqui para ver uma versão maior desta figura.

Figura 5: Boxplots de recordação e contaminação (precisão 1). Os boxplots para as três categorias de macroinvertebrados, outros invertebrados e detritos (300 vinhetas por categoria) do conjunto de aprendizagem selecionado validado em um subconjunto de amostras (n = 42). Por favor, clique aqui para ver uma versão maior desta figura.

Figura 6: Comparação entre as estimativas de abundância e volume elipsoidal médio na classificação automática versus validada. (A) Estimativas de abundância nas subamostras (n = 42) e (B) estimativas médias de volume elipsoidal nas subamostras (n = 42). Os pontos escuros correspondem às subamostras grosseiras (malha >0,5 cm); os pontos cinzentos correspondem às subamostras finas (malha de >500 μm). A linha tracejada representa a relação 1:1. Por favor, clique aqui para ver uma versão maior desta figura.

Figura 7: Funções de densidade de probabilidade que representam a contribuição relativa (eixo y) do tamanho individual na escala logarítmica (eixo x) para comparação entre estimativas automáticas e entre estimativas validadas. (A,B) Estimativas automáticas e validadas para subamostras grosseiras (n = 18), (C,D) Estimativas automáticas e validadas para subamostras finas (n = 24). (A,C) Comparação entre estimativas automáticas e comparação (B,D) entre estimativas validadas. As cores representam cada subamostra para ajudar a discernir os espectros. Por favor, clique aqui para ver uma versão maior desta figura.

Figura 8: Comparação entre as estimativas de abundância e volume elipsoidal médio em subamostras validadas versus subamostras validadas após a separação de objetos tocantes de amostras naturais selecionadas (subamostras finas e grosseiras juntas). (A) Estimativas de abundância por quadro amostral (n = 5) e (B) estimativas de volume elipsoidal médio (n = 5). A linha tracejada representa a relação 1:1. Por favor, clique aqui para ver uma versão maior desta figura.

Figura 9: Funções de densidade de probabilidade que representam a contribuição relativa (eixo y) do tamanho individual na escala log₂ (eixo x) para a previsão automática, previsão validada e previsão validada com seus respectivos valores de diversidade de tamanho (Sd). (A-E) Funções de densidade de probabilidade para amostras naturais selecionadas (subamostras finas e grosseiras juntas) (n = 5); a linha vermelha corresponde à previsão automática, a linha azul corresponde à previsão validada e a linha verde corresponde às amostras corrigidas (validadas após a separação dos objetos tocantes). (F) Comparação de estimativas de diversidade de tamanho validadas versus corrigidas; a linha tracejada corresponde à relação 1:1. Por favor, clique aqui para ver uma versão maior desta figura.

Figura 10: Espectros de tamanho de biovolume normalizado (NBSS) e comparação de inclinações de NBSS (μ) entre tratamentos. (A-E) NBSS representando a relação entre o valor de ponto médio de cada classe de tamanho na escala logarítmica (eixo x) versus o biovolume normalizado por quadro de varredura (eixo y) das cinco amostras selecionadas para as previsões automáticas (cruzes vermelhas), validadas (triângulos azuis) e corrigidas (círculos verdes) com seus respectivos espectros de tamanho inclinações (μ) calculadas nas classes de tamanho a partir da classe de tamanho modal e para cima (a terceira classe de tamanho é indicada pela linha tracejada vertical). (F) Comparação das inclinações calculadas nas amostras validadas versus as corrigidas (após a separação dos objetos tocantes). A linha tracejada corresponde à relação 1:1, r². Por favor, clique aqui para ver uma versão maior desta figura.

Arquivo Suplementar 1: Script Matlab para executar os cálculos. Clique aqui para baixar este arquivo.

Arquivo Suplementar 2: Validação cruzada, recordação e precisão 1 dos conjuntos de aprendizado criados. (A) Conjunto de aprendizagem bruta com 3 categorias e 50 vinhetas por categoria; (B) conjunto de aprendizagem bruta com 3 categorias e 100 vinhetas por categoria; (C) conjunto de aprendizagem bruta com 3 categorias e 300 vinhetas por categoria; (D) conjunto de aprendizagem bruta com 3 categorias e 500 vinhetas por categoria; (E) conjunto de aprendizagem bruta com 5 categorias e 50 vinhetas por categoria; (F) conjunto de aprendizagem bruta com 5 categorias e 100 vinhetas por categoria; (G) conjunto de aprendizagem bruta com 5 categorias e 300 vinhetas por categoria; (H) conjunto de aprendizagem intermediária com 16 categorias e 50 vinhetas por categoria; (I) conjunto de aprendizagem intermediária com 16 categorias e 100 vinhetas por categoria; (J) conjunto de aprendizagem intermediária com 16 categorias e 300 vinhetas por categoria; (K) conjunto de aprendizagem fino com 20 categorias e 50 vinhetas por categoria; (L) conjunto de aprendizagem fino com 20 categorias e 100 vinhetas por categoria; e (M) conjunto de aprendizado fino com 20 categorias e 300 vinhetas por categoria. Clique aqui para baixar este arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

A adaptação da metodologia descrita por Gorsky et al. 2010 para macroinvertebrados ribeirinhos permite alta acurácia de classificação na estimativa da estrutura do tamanho da comunidade em macroinvertebrados de água doce. Os resultados sugerem que o protocolo pode reduzir o tempo para estimar a estrutura de tamanho individual em uma amostra para cerca de 1 hora. Assim, o protocolo proposto pretende promover o uso rotineiro de espectros de tamanho de macroinvertebrados como um bioindicador rápido e integrador para avaliar o impacto de perturbações em ecossistemas de água doce. O espectro de tamanho dos macroinvertebrados já foi utilizado como índice de sucesso para avaliar o estado ecológico das lagoas costeiras²². Com o desenvolvimento do protocolo, levantamentos intensivos em invertebrados podem ser realizados para possibilitar campanhas de monitoramento de campo que abranjam grandes escalas espaciais e temporais.

Como o objetivo deste protocolo é obter a distribuição de tamanho individual da comunidade amostrada de forma rápida, desconsiderando a taxonomia, recomenda-se a criação de um conjunto de aprendizagem simples como o aqui proposto. Testes de conjuntos de aprendizagem mais finos, com maior número de categorias, conferem menor recordação e precisão para os macroinvertebrados como um todo (Tabela 2), sendo a etapa de validação mais demorada.

A predição automática concordou fortemente com a predição validada de 42 subamostras naturais de diferentes locais de amostragem, sugerindo que o método em modo automático é adequado para contagem e medição dos macroinvertebrados em amostras naturais (Figura 6). Além disso, a semelhança nos NBSSs entre as predições automática e validada e o alto ajuste ao modelo teórico linear sugere que o modo automático é um método promissor para a realização de estudos ecológicos teóricos (Figura 10).

Durante a adaptação deste protocolo, vários problemas foram encontrados, e eles foram resolvidos ou minimizados de diferentes maneiras. Uma questão a ter em consideração ao digitalizar amostras de macroinvertebrados é o aparecimento de áreas saturadas escuras. Assim, é importante verificar as imagens processadas e digitalizadas o mais rápido possível para detectar esse problema e repetir a varredura, se necessário. Este problema também foi encontrado ao escanear o plâncton³³, mas é aumentado pelo uso de etanol em vez de água da torneira. Não é recomendado o uso de água da torneira, pois os organismos preservados em etanol a 70% flutuarão na superfície. Embora o dispositivo seja projetado para resistir ao etanol diluído (5%), as amostras de invertebrados são preservadas com etanol a 70%. Operar com menores concentrações de etanol também não é recomendado, pois os organismos podem ser danificados por processos de reidratação e desidratação³⁷. A solução proposta, que é altamente recomendada, é enxaguar a bandeja de varredura com água fresca várias vezes após cada varredura realizada com etanol. Isso evita o acúmulo de precipitados que podem alterar o fundo da imagem e protege o vidro da bandeja de varredura da corrosão.

Outro problema detectado é a presença de vinhetas com múltiplos organismos, o que pode alterar o espectro de tamanho devido à subestimação de indivíduos de certos tamanhos. Quando o número de vinhetas com múltiplos objetos é baixo (<10%), como neste estudo, a presença de múltiplos objetos tem pequena influência nas distribuições de tamanho e NBSSs nessas amostras (Figura 9 e Figura 10). Isso indica que, para obter uma estrutura de tamanho representativa da comunidade de macroinvertebrados, não é necessário investir tempo na etapa 1.5 do protocolo (a separação dos organismos tocantes), para a qual o reprocessamento da imagem dura cerca de 1,5 h. Em vez disso, é altamente recomendável ter tempo na etapa 2.5 do protocolo (separando organismos ou agregados tocando usando uma agulha de madeira), que é muito menos demorada (máximo de 30 min) e garante uma estimativa adequada das distribuições de tamanho no modo automático³⁰. Uma opção para reduzir o número de organismos que tocam é trabalhar com menos organismos por varredura, mas o compromisso de tempo investido na varredura de uma amostra em um alto número de frações e a possibilidade de agregação de organismos devem ser levados em consideração. Outra solução seria preservar apenas uma subamostra que permitisse calcular um espectro de tamanho representativo ao classificar os organismos em laboratório, em vez de preservar todos os organismos amostrados, como feito neste trabalho. A redução no número de organismos por amostra reduziria a probabilidade de tocar organismos. Além disso, quando menos indivíduos são armazenados, a amostra contém menos detritos, o que facilita a separação, especialmente se as fibras puderem ser evitadas.

A limitação observada do método de classificação automática está relacionada à baixa presença de microcrustáceos (categoria: outros macroinvertebrados) nas amostras utilizadas. A falta de representação dos microcrustáceos pode afetar sua correta classificação e limitar a precisão da predição automática para essa categoria. No entanto, as demais categorias, detritos e macroinvertebrados, que são o principal objetivo deste trabalho, apresentam alta recordação e precisão. Alternativas ao uso deste dispositivo de scanner seriam adaptar um scanner comum para armazenar quadros de água, promover códigos de código aberto para processamento de amostras e aprendizado de máquina, como o fornecido aqui, e escrever códigos para medir organismos sob o microscópio com uma câmera ou através do fluxo com um conjunto de câmeras. Isso tem sido feito em várias ocasiões 23,24,25,26,38,39,40, mas o método que propomos regula a parametrização de varredura para obter estimativas de tamanho comparáveis^, o que é difícil de controlar com os outros sistemas. Além disso, o protocolo proposto e o dispositivo de varredura estão prontos para uso, de código aberto e já estabelecidos na comunidade de mesozooplâncton marinho. No geral, a adaptação deste protocolo demonstra um caminho promissor para o uso deste método de imagem automática para obter a estrutura de tamanho de macroinvertebrados de água doce de forma eficiente e para testar o potencial de métricas de tamanho para a bioavaliação de água doce.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores declaram não haver potenciais interesses concorrentes.

Acknowledgments

Este trabalho foi apoiado pelo Ministério da Ciência, Inovação e Universidades espanholas (número de intervenção RTI2018-095363-B-I00). Agradecemos aos membros do CERM-UVic-UCC Èlia Bretxa, Anna Costarrosa, Laia Jiménez, María Isabel González, Marta Jutglar, Francesc Llach e Núria Sellarès por seu trabalho em amostragem de campo de macroinvertebrados e triagem laboratorial e a David Albesa por colaborar na digitalização de amostras. Finalmente, agradecemos a Josep Maria Gili e ao Institut de Ciències del Mar (ICM-CSIC) pelo uso das instalações laboratoriais e do dispositivo de scanner.

Materials

Name	Company	Catalog Number	Comments
Beaker	Labbox		Other containers could be used
Dionized water	Icopresa	8420239600123	To dilute the ethanol
Funnel	Vitlab	41094
Glass vials 8 ml	Labbox	SVSN-C10-195	1 vial/subsample
ImageJ Software	Free access		Version 4.41o/ Image processing software
Large frame	Hydroptic	Provided by ZooScan	24.5 cm x 15.8 cm
Monalcol 96 (Ethanol 96)	Montplet	1050JE001
Plankton Identifier Software	Free access		Version 1.2.6/ Automatic identification software
Sieve	Cisa	26852.2	Nominal aperture 500µ and nominal aperture 0,5 cm
Tweezers	Bondline	B5SA	Stainless, anti-magnetic, anti-acid
VueScan 9 x 64 (9.5.09) Software	Hydroptic		Version 9.0.51/ Sacn software
Wooden needle			Any plastic or wood needle can be used
Zooprocess Software	Free access		Version 7.14/Image processing software
ZooScan	Hydroptic	54	Version III/ Scanner