Анализ задачи распознавания пневмонии при помощи глубокого обучения

Дата публикации: 2020-06-20 13:51:35
Статью разместил(а):
Акчурин Динар Альбертович

Анализ задачи распознавания пневмонии при помощи глубокого обучения

Pneumonia recognizing problem analysis using deep learning

 

Автор: Акчурин Динар Альбертович

ФГБОУ ВО «УГАТУ», Уфа, Россия

e-mail: dinar667@yandex.ru

Akchurin Dinar Albertovich

USATU, Ufa, Russia

e-mail: dinar667@yandex.ru

 

Аннотация: Статья посвящена анализу задачи распознавания пневмонии с использованием машинного обучения. Приводятся результаты проведённого анализа предметной области для решения задачи, который позволил выбрать необходимые методы и сделать соответствующие выводы.

Abstract: The article is devoted to the analysis of the pneumonia recognition problem using machine learning. The results of the analysis of the subject area to solve the problem, which allowed to select the necessary methods and draw the appropriate conclusions, are presented.

Ключевые слова: машинное обучение, распознавание пневмонии, глубокое обучение.

Keywords: machine learning, pneumonia recognition, deep learning.

Тематическая рубрика: IT-технологии и цифровые процессы.

 

В современной медицине огромное значение придается диагностике. Грамотно и вовремя поставленный диагноз зачастую способен не просто улучшить прогноз лечения, но и спасти жизнь пациента. Особенно важно это для стран с высоко развитой химической промышленностью. В связи с этим растёт необходимость в постоянном и регулярном наблюдении состояния органов грудной клетки для предупреждения или обнаружения болезни, прежде чем оно скажется на здоровье человека. Представленные действия могут быть осуществлены различными способами: рентгенографией, магнитно-резонансной томографией и другими процедурами. В работе коснёмся распознавания аномалии лёгких посредством фотографии рентгена грудной клетки.

Рентгенография – проецирование внутренней структуры органов грудной клетки с помощью рентгеновских лучей на специальную плёнку или бумагу. Она остаётся на сегодняшний день наиболее простым и доступным для населения методом определения заболевания на начальной стадии.

У специалистов медицинской области существует большое количество способов постановки диагнозов пациентов. Одним из них является анализ рентгенограмм. Данный вид широко распространён по всему миру и по-прежнему остаётся приоритетным в медицинской практике клиник и медицинских центров. Несмотря на все плюсы этого метода, анализ и выявление признаков заболевания по рентгеновским снимкам является довольно сложной задачей, требующей высококвалифицированных специалистов. Сложность анализа заключается, как правило, в низком разрешении изображений или наличии различного рода «шумов» (например, наличие на снимке посторонних предметов).

Целью работы является анализ нескольких подходов к обучению нейронной сети для определения наличия аномалий лёгких у пациента на распознавания.

Для достижения цели необходимо выполнить следующие задачи:

- выполнить анализ предметной области;

- выполнить анализ литературных источников предметной области;

- описать постановку задачи;

- разработать концептуальную модель нейронной сети;

- подготовить набор необходимых экспериментальных данных;

- разработать программное обеспечение;

- выполнить анализ полученных результатов.

Объектом исследования является применение глубокого машинного обучения для распознавания объектов на изображении. Предмет исследования – процесс распознавания пневмонии в лёгких пациентов. 

Актуальность работы связана с широким развитием методов распознавания патологий лёгких по рентгеновским снимкам. Немаловажным фактом здесь выступает активность вирусных инфекций, поражающих преимущественно лёгкие человека.

В соответствие с анализом был выбран язык программирования Python версии 3.6.5 и среда разработки PyCharm (Professional Edition), для обучающей части для большей наглядности вычислений выбран инструмент интерактивной разработки «Jupyter Notebook».

В качестве выходных данных для обучающей части должна выступать обученная модель нейронной сети в формате «HDF5».

Проанализировав исходные данные, можно говорить как минимум о двух возникающих проблемах.

Во-первых, общее количество данных достаточно невелико, что обычно негативно сказывается на обучении нейронных сетей, поскольку сеть в таком случае получает недостаточное количество образов для запоминания.

Во-вторых, выборки не являются сбалансированными – снимков случаев с пневмонией для обучающей выборки практически в два раза больше, чем снимков здоровых пациентов. Это может привести к тому, что нейронная сеть для минимизации ошибки будет иметь смещение в сторону выборки с большим количеством данных.

Существует две стратегии избавления от этой проблемы:

1) уравнять количество данных каждой категории, например, путём отбора из каждой выборки количества примеров равного размеру меньшей выборки;

2) применить аугментацию (data augmentation).

Организация структуры интерфейсной части разработана согласно архитектуре MVVM, реализованной в рамках языка программирования Python.

По результатам анализа были сделаны следующие выводы:

1) использование методов аугментации и заранее обученных моделей нейронных сетей показывают большую точность даже при небольшом количестве данных;

2) размер входного изображения оказывает влияние на качество прогноза нейронной сети.  

 

Список литературы:

1. Грекул В.И. Проектирование информационных систем: учебник / В.И. Грекул, Г.Н. Денищенко. – М.: Интернет-Университет информационных технологий, 2005. – 304 с.

2. Ефремов А. Поиск аномалий в рентгеновских снимках при помощи глубокого машинного обучения с использованием предварительной обработки снимков для сегментации легких и удаления костей. Бакалаврская работа / А. Ефремов. – СПбГУ: 2018. – 30 с.

3. Форсайт Дэвид А. Компьютерное зрение. Современный подход / А. Дэвид Форсайт, Д. Понс. – М.: Вильямс, 2004. – 928 с.