$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Сбор данных
Чтобы проверить наш инструментарий, мы проанализировали две отдельные канальцевые сети в ткани печени взрослых мышей: желчные каналы (БК) и синусоидальные сети. Для каждой структуры для обучения использовалось одно изображение 3D-микроскопии от одного животного, в то время как два независимых изображения от разных животных использовались исключительно для тестирования. Все изображения печени были получены с изотропным воксельным разрешением 0,3 мкм/воксель, что обеспечивает согласованную выборку в трех пространственных измерениях. Набор данных, первоначально опубликованный в Morales-Navarrete et al.9, был подобран с использованием Labkit25, предоставляя высококачественные бинарные маски трубчатых структур, используемые в качестве основы для контролируемого обучения. Для синусоидальной сети мы создали два типа бинарных масок: одну, очерчивающую границы трубки (полое представление), и другую, захватывающую заполненный объем трубки, что позволяет использовать различные стратегии обучения в зависимости от приложения.
Кроме того, мы оценили наш инструментарий на внешнем наборе данных кровеносных сосудов всего мозга взрослого Mus musculus, предоставленном в рамках конкурса SELMA3D 2024 года. Этот набор данных состоит из 3D-изображений световой микроскопии, полученных в стандартных условиях содержания (12 часов светового цикла/12 часов темного цикла в течение 3 месяцев) и доступен через BioStudies (S-BIAD1197) images26. Пять изображений мозга были использованы для обучения и девятнадцать для тестирования. Исходные анизотропные стеки были пересчитаны до размеров изотропных вокселей с использованием линейной интерполяции на Фиджи для обеспечения совместимости с нашим конвейером анализа.
Предварительная обработка
Чтобы справиться с ограниченным числом исходных 3D-изображений, мы применили методы дополнения данных, которые вносили реалистичные артефакты изображения и моделировали различное соотношение сигнал/шум в диапазоне от 15 до 1. Этот подход имел решающее значение для повышения обобщаемости и надежности моделей.
Тестовое изображение было разделено на неперекрывающиеся участки размером 64 x 64 x 64 вокселя для оценки производительности модели на региональном уровне и оценки надежности в различных пространственных контекстах в рамках одного и того же 3D-объема.
Архитектура модели
Мы реализовали и сравнили две архитектуры сверточных нейронных сетей, заточенные под 3D-сегментацию:
Стандартный 3D U-Net17, состоящий из симметричных блоков энкодера-декодера с максимальным объединением 2×2×2, сверточных слоев с активациями ReLU и окончательной свертки 1 x 1 с последующей сигмоидальной функцией для двоичной классификации.
Система Attention U-Net27, которая включает в себя механизм внимания, который динамически выделяет характерные особенности и подавляет нерелевантный фон, улучшая сегментацию сложных и вариабельных структур, таких как сети печеночных канальцев.
Протокол тренировки
Обе архитектуры были обучены с использованием библиотек TensorFlow и Keras на высокопроизводительном вычислительном кластере, оснащенном 32 ядрами CPU, 128 ГБ ОЗУ и двумя графическими процессорами NVIDIA A100 SXM4 40 ГБ. Attention U-Net требовал больше времени на обучение из-за сложности архитектуры, особенно при использовании дополненных наборов данных (см. таблицу 1).
Метрики оценки
Производительность модели количественно оценивалась на тестовых изображениях с использованием стандартных метрик сегментации: коэффициент Dice, Intersection over Union (IoU), оценка F1, сходство объема, а также чувствительность и специфичность.
Результаты для РМЖ, синусоидальных структур и сосудов обобщены на рисунках 2, 3, 4 и 5. Кроме того, в таблице 2 представлено сравнение производительности с установленными классическими методами трубчатой сегментации, включая метод Оцу и адаптивное пороговое значение. Наши модели, в частности Attention U-Net, обученный на дополненных данных, неизменно превосходили эти традиционные методы по всем показателям.
Статистический анализ и надежность
Анализ целых изображений, а также воксельных участков размером 64 x 64 x 64 x 64 (Таблица 3) в тестовом наборе позволил нам также количественно оценить пространственную изменчивость прогнозов модели по регионам. Все модели продемонстрировали высокую точность, при этом Attention U-Net показал стабильно более высокую производительность, особенно в рейтинге F1 и коэффициенте Dice. Качественные результаты, представленные на рисунках 2A, B, 3A, B, 4A, B, 5A, B, а также на видео 1, видео 2, видео 3 и видео 4, подтверждают эти выводы, иллюстрируя точное очерчивание трубчатых структур в большинстве областей тестовых данных.
Объяснение аномалий в метриках производительности
Более низкие значения ящичковых диаграмм для анализа патчей (дополнительный рисунок S1, дополнительный рисунок S2, дополнительный рисунок S3, дополнительный рисунок S4 и дополнительный рисунок S5) указывают на наличие выбросов производительности в подмножестве тестовых патчей. Аналогичным образом, неоптимальная сегментация в финальных кадрах видео может быть связана с двумя ключевыми факторами:
Граничные эффекты: производительность сегментации часто ухудшается на границах изображения, где частичные структуры недостаточно представлены или не полностью охвачены, что приводит к большей неопределенности и потенциальной неправильной классификации.
Ухудшение качества изображения в более глубоких z-плоскостях: несмотря на размер изотропных воксолей, биологические и технические факторы, такие как затухание сигнала, рассеяние света и снижение контрастности в z-направлении, приводят к снижению качества изображения в нижней части объема. Такое ухудшение затрудняет точное определение границ и приводит к несоответствиям сегментации.
Эти факторы являются неотъемлемыми проблемами при 3D-биологической визуализации и особенно важны в регионах, удаленных от плоскости изображения или содержащих неоднозначные структурные границы.
Таким образом, наши результаты демонстрируют, что модели сегментации на основе глубокого обучения, в частности Attention U-Net, обученный с помощью дополненных данных, обеспечивают надежное и точное очерчивание сложных трубчатых структур на 3D-изображениях микроскопии печени. Используя тщательно отобранные наборы данных, реалистичные стратегии дополнения и механизмы внимания, модели достигли превосходной производительности по сравнению с классическими методами, такими как пороговое значение. Региональная оценка с использованием 64³ воксельных патчей подтвердила согласованность и обобщаемость подхода для различных областей изображения и структурных сложностей. Несмотря на то, что некоторые ограничения сохраняются, в основном из-за граничных эффектов и ухудшения качества изображения в z-плоскости, наше исследование подчеркивает эффективность архитектур, основанных на внимании, и предоставляет проверенное решение с открытым исходным кодом для высокоточной 3D-сегментации труб в биомедицинской визуализации.

Рисунок 1: Рабочий процесс 3D-сегментации трубчатых структур на изображениях флуоресцентной микроскопии с использованием моделей U-Net и Attention U-Net. (A) Подготовка данных: Схематические 2D-срезы 3D-изображений ткани печени мыши, полученных методом флуоресцентной микроскопии, с отображением исходных изображений и соответствующих бинарных масок. (B) Дополнение данных: Дополнение подготовленных данных на основе моделирования, создание изображений с различным отношением сигнал/шум (например, SNR = 15 и SNR = 1). (C) Обучение моделей: Обучение моделей U-Net и Attention U-Net на основе патчей с использованием как исходных, так и дополненных данных. Для тренировки генерируются патчи изображения и маски размером 64 х 64 х 64. (D) Оценка модели: для каждой модели рассчитываются количественные показатели эффективности, включая Recall и F1 Score, чтобы оценить точность сегментации на тестовых наборах данных. (E) Вывод модели: Применение обученной модели на невидимых изображениях для создания прогнозируемых масок сегментации. Сокращение: SNR = отношение сигнал/шум. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

Рисунок 2: Оценка моделей U-Net и Attention U-Net для сегментации сети Bile Canaliculi на основе изображений ткани печени мыши, полученных с помощью флуоресцентной микроскопии. (A) Репрезентативные 2D-срезы (средний срез) изображений 3D-флуоресцентной микроскопии, отображающие исходное изображение и соответствующую наземную маску для РМЖ в ткани печени мыши. Изображения в правом верхнем углу обеспечивают увеличенное изображение вставок, выделенных в каждом разделе. (B) Предсказанные маски сегментации, генерируемые U-Net, Attention U-Net и их дополненными версиями. В верхней строке выделены истинно положительные (правильно сегментированные структуры), в нижней — ложноположительные (неправильно идентифицированные структуры) и ложноотрицательные (пропущенные структуры) для каждой модели. (C) Количественные метрики оценки для каждой модели, включая точность, оценку F1, точность, полноту, сходство объема и коэффициент кубиков. Оценка проводилась в патчах, выдавленных из 3D-изображения. Полосы погрешностей обозначают стандартные отклонения на тестовых изображениях. Масштабная линейка: 60 μм; Врезная масштабная линейка: 30 мкм. Сокращение: BC = желчные каналы. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

Рисунок 3: Оценка моделей U-Net и Attention U-Net для сегментации синусоидальной сети на основе изображений ткани печени мыши, полученных с помощью 3D-флуоресцентной микроскопии. (A) Репрезентативные 2D-срезы (средний срез) изображений 3D флуоресцентной микроскопии, отображающие исходное изображение и соответствующую наземную маску для синусоид в ткани печени мыши. Изображения в правом верхнем углу обеспечивают увеличенное изображение вставок, выделенных в каждом разделе. (B) Предсказанные маски сегментации, генерируемые U-Net, Attention U-Net и их дополненными версиями. В верхней строке выделены истинно положительные (правильно сегментированные структуры), в нижней — ложноположительные (неправильно идентифицированные структуры) и ложноотрицательные (пропущенные структуры) для каждой модели. (C) Количественные метрики оценки для каждой модели, включая точность, оценку F1, точность, полноту, сходство объема и коэффициент кубиков. Оценка проводилась в патчах, выдавленных из 3D-изображения. Полосы погрешностей обозначают стандартные отклонения на тестовых изображениях. Масштабная линейка: 60 μм; Масштабная линейка-врезка: 30 мкм. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 4: Оценка моделей U-Net и Attention U-Net для сегментации синусоидальной сети по изображениям ткани печени мыши, полученных с помощью 3D-флуоресцентной микроскопии, рассматривая маску в виде заполненных пробирок. (A) Репрезентативные 2D средние срезы изображений 3D флуоресцентной микроскопии, отображающие исходное изображение и соответствующую наземную маску для синусоид в ткани печени мыши. Изображения в правом верхнем углу обеспечивают увеличенное изображение вставок, выделенных в каждом разделе. (B) Предсказанные маски сегментации, генерируемые U-Net, Attention U-Net и их дополненными версиями. В то время как верхняя строка выделяет истинно положительные (правильно сегментированные структуры), нижняя показывает ложные срабатывания (неправильно идентифицированные структуры) и ложноотрицательные (пропущенные структуры) для каждой модели. (C) Количественные метрики оценки для каждой модели, включая точность, оценку F1, точность, полноту, сходство объема и коэффициент кубиков. Оценка проводилась в патчах, выдавленных из 3D-изображения. Полосы погрешностей обозначают стандартные отклонения на тестовых изображениях. Масштабная линейка: 60 μм; Масштабная линейка-врезка: 30 мкм. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 5: Оценка моделей U-Net и Attention U-Net для сегментации сосудистой сети в мозге мыши по изображениям 3D-световой микроскопии с использованием масок с заполненными трубками. (A) Репрезентативные 2D-средние срезы, извлеченные из 3D-изображений мозга мыши, полученных в световой микроскопии, показывающие исходное изображение и соответствующую наземную маску для кровеносных сосудов. Увеличенные виды выбранных вставок отображаются в правом верхнем углу каждой панели. Предсказанные маски сегментации, сгенерированные U-Net, Attention U-Net и их дополненными версиями. В верхнем ряду выделены истинно положительные результаты (правильно сегментированные структуры сосудов), а в нижней строке — ложноположительные (неправильно сегментированные области) и ложноотрицательные результаты (пропущенные структуры сосудов) для каждой модели. (C) Количественная оценка производительности модели с использованием таких показателей, как точность, оценка F1, точность, полнота, сходство объема и коэффициент кубиков. Оценка проводилась на 3D-патчах, извлеченных из тестовых томов. Полосы погрешностей представляют собой стандартные отклонения по 19 тестовым изображениям. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.
Видео 1: Z-Stack анимация предсказанных масок для сети BC. В видео показана анимированная последовательность через z-стек предсказанных сегментационных масок для желчных каналов в ткани печени мыши, сгенерированных U-Net, Attention U-Net и их дополненными версиями. В каждом 2D-разделе выделены истинно положительные результаты (белый), ложные срабатывания (зеленый) и ложноотрицательные результаты (пурпурный) для каждой модели, перемещаясь по всему стеку. Сокращение: BC = желчные каналы. Пожалуйста, нажмите здесь, чтобы скачать это видео.
Видео 2: Z-Stack анимация предсказанных масок для синусоидальной сети. В видео показана анимированная последовательность через z-стек предсказанных сегментационных масок для синусоид в ткани печени мыши, сгенерированных U-Net, Attention U-Net и их дополненными версиями. В каждом 2D-разделе выделены истинно положительные результаты (белый), ложные срабатывания (зеленый) и ложноотрицательные результаты (пурпурный) для каждой модели, перемещаясь по всему стеку. Пожалуйста, нажмите здесь, чтобы скачать это видео.
Видео 3: Z-Stack анимация предсказанных масок для синусоидальной сети в виде заполненных трубок. В видео показана анимированная последовательность через z-стек предсказанных сегментационных масок для синусоидальной сети в виде заполненных трубок в ткани печени мыши, сгенерированных U-Net, Attention U-Net и их дополненными версиями. В каждом 2D-разделе выделены истинно положительные результаты (белый), ложные срабатывания (зеленый) и ложноотрицательные результаты (пурпурный) для каждой модели, перемещаясь по всему стеку. Пожалуйста, нажмите здесь, чтобы скачать это видео.
Видео 4: Z-Stack анимация предсказанных масок для сосудов головного мозга. В видео показана анимированная последовательность через z-стек предсказанных масок сегментации для судов, сгенерированных U-Net, Attention U-Net и их дополненными версиями. В каждом 2D-разделе выделены истинно положительные результаты (белый), ложные срабатывания (зеленый) и ложноотрицательные результаты (пурпурный) для каждой модели, перемещаясь по всему стеку. Пожалуйста, нажмите здесь, чтобы скачать это видео.
Таблица 1: Время обучения для 3D-моделей U-Net и Attention U-Net 3D на наборах данных Bile Canaliculi и Sinusoid с аугментацией данных и без нее. Время обучения моделей U-Net 3D и Attention U-Net 3D на наборах данных желчных каналов и синусоид с аугментацией данных и без нее. В таблице указано количество патчей для каждого набора данных и соответствующее время обучения в минутах. Аугментация данных увеличивает количество патчей с 1353 до 10824, что приводит к значительному увеличению времени обучения. Модель Attention U-Net неизменно требует больше времени на обучение, чем модель U-Net, особенно с дополненными наборами данных, из-за дополнительной сложности концентрации внимания на релевантных признаках данных. Сокращение: BC = желчные каналы. Пожалуйста, нажмите здесь, чтобы скачать эту таблицу.
Таблица 2: Количественная оценка моделей U-Net 3D и Attention U-Net 3D по четырем наборам данных с использованием сегментации всего изображения. В этой таблице представлена производительность каждой модели, а также классических методов, таких как Оцу и адаптивный порог, на четырех различных наборах данных: желчные каналы, синусоидальные сети (полые и заполненные представления) и сосудистая сеть всего мозга с использованием цельных 3D-изображений для оценки. Для каждой комбинации модели и набора данных указано количество тестовых изображений, а также метрики производительности: точность, точность, полнота (чувствительность), специфичность, оценка F1, коэффициент Dice, IoU и сходство объема. Эти метрики обеспечивают всестороннюю оценку качества сегментации с точки зрения как воксельной корректности, так и объемного согласия между прогнозами и наземной достоверностью. Сокращения: BC = желчные каналы; IoU = Пересечение через Юнион. Пожалуйста, нажмите здесь, чтобы скачать эту таблицу.
Таблица 3: Количественная оценка моделей U-Net 3D и Attention U-Net 3D на четырех наборах данных с использованием патчей размером 64 x 64 x 64 . В этой таблице обобщена производительность моделей U-Net 3D и Attention U-Net 3D на четырех наборах данных — желчных каналах, синусоидальных сетях (полых и заполненных масках) и сосудистых сетях всего мозга — на основе оценки в 3D-изображениях участков размером 64×64×64 вокселя. Для каждой комбинации модели и набора данных количество тестовых патчей указано вместе с ключевыми метриками производительности: точностью, точностью, полнотой (чувствительностью), специфичностью, оценкой F1, коэффициентом Dice, пересечением через объединение и объемным сходством. Эти метрики на уровне патчей позволяют получить локализованное представление о производительности модели и особенно полезны для определения пространственно неоднородной точности сегментации по объемам. Сокращения: BC = желчные каналы; IoU = Пересечение через Юнион. Пожалуйста, нажмите здесь, чтобы скачать эту таблицу.
Дополнительный рисунок S1: Производительность сегментации на уровне патчей моделей 3D U-Net и Attention U-Net для сегментации желчных каналов. Графики иллюстрируют количественную производительность моделей 3D U-Net и Attention U-Net на наборах данных желчных каналов, оцененных с использованием участков 3D-изображений размером 64 x 64 x 64 вокселей. Отображаемые метрики включают точность, прецизионность, полноту (чувствительность), специфичность, оценку F1, коэффициент кубиков, пересечение через объединение и сходство объема. Результаты отражают вариабельность между участками, обеспечивая локализованное понимание производительности модели и выделяя пространственную неоднородность в объемах 3D-ткани печени. Сокращения: BC = желчные каналы; IoU = Пересечение через Юнион. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.
Дополнительный рисунок S2: Производительность сегментации на уровне патчей моделей 3D U-Net и Attention U-Net для сегментации синусоид. Графики иллюстрируют количественную производительность моделей 3D U-Net и Attention U-Net на синусоидальных наборах данных, оцененных с помощью участков 3D-изображений размером 64 x 64 x 64 вокселей. Отображаемые метрики включают точность, прецизионность, полноту (чувствительность), специфичность, оценку F1, коэффициент кубиков, пересечение через объединение и сходство объема. Результаты отражают вариабельность между участками, обеспечивая локализованное понимание производительности модели и выделяя пространственную неоднородность в объемах 3D-ткани печени. Аббревиатура: IoU = Пересечение через Союз. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.
Дополнительный рисунок S3: Производительность сегментации на уровне патчей моделей 3D U-Net и Attention U-Net для сегментации синусоид в виде заполненных трубок. Графики иллюстрируют количественную производительность моделей 3D U-Net и Attention U-Net на синусоидах в виде наборов данных заполненных трубок, оцененных с помощью участков 3D-изображений размером 64 x 64 x 64 вокселей. Отображаемые метрики включают точность, прецизионность, полноту (чувствительность), специфичность, оценку F1, коэффициент кубиков, пересечение через объединение и сходство объема. Результаты отражают вариабельность между участками, обеспечивая локализованное понимание производительности модели и выделяя пространственную неоднородность в объемах 3D-ткани печени. Аббревиатура: IoU = Пересечение через Союз. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.
Дополнительный рисунок S4: Производительность сегментации на уровне патчей моделей 3D U-Net и Attention U-Net для сосудистой сети головного мозга на основе изображений световой микроскопии. Графики иллюстрируют количественную производительность моделей 3D U-Net и Attention U-Net на наборах данных сосудистой сети всего мозга, оцененных с использованием участков 3D-изображений размером 64 x 64 x 64 вокселей. Отображаемые метрики включают точность, прецизионность, полноту (чувствительность), специфичность, оценку F1, коэффициент кубиков, пересечение через объединение и сходство объема. Результаты отражают вариабельность между участками, обеспечивая локализованное понимание производительности модели и выделяя пространственную неоднородность в объемах 3D-ткани печени. Аббревиатура: IoU = Пересечение через Союз. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.
Дополнительный рисунок S5: Наложение результатов сегментации на исходные изображения желчных каналов, полученные методом флуоресцентной 3D-флуоресцентной микроскопии. Репрезентативные срезы изображений из наборов данных 3D-флуоресцентной микроскопии желчных каналов в печени мышей показаны с сегментационными масками, наложенными красным цветом. Предсказанные маски из моделей 3D U-Net и Attention U-Net накладываются на исходные изображения микроскопии в оттенках серого для визуальной оценки точности сегментации. Десять примеров изображений представлены для иллюстрации способности моделей улавливать различные морфологические особенности и обрабатывать изменчивость сигнала в различных областях тканей. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.