26 января 2026

Использование методов машинного обучения для диагностики заболеваний на основе неструктурированных медицинских текстов

36

Ермак А.Д., Макарова Е.А., Кафтанов А.Н., Гаврилов Д.В., Новицкий Р.Э., Гусев А.В.

Современные методы машинного обучения открывают новые возможности для анализа медицинских текстов. Использование неструктурированных данных позволяет улучшить качество поддержки принятия врачебных решений и развивать персонализированные подходы к лечению пациентов.

Цель исследования: Разработка оптимального алгоритма прогнозирования заболеваний с помощью мультиметочной классификации на основании медицинских текстов из отобранных случаев лечения пациентов.

Материалы и методы. В исследовании использовались анонимизированные электронные медицинские карты 387 590 пациентов. Для анализа текстовой информации применялись методы лемматизации и векторизации на основе предобученной модели FastText. Разработана мультиметочная модель классификации, предсказывающая 156 диагностических категорий, сгруппированных по основным группам заболеваний. Для построения моделей применялись нейросетевые архитектуры и ансамбли деревьев решений.

Результаты. Предложенные модели показали высокую эффективность. Использование различных методов агрегации текстовых векторов позволило повысить качество прогнозирования. Модель продемонстрировала стабильность и клиническую интерпретируемость результатов, обеспечивая возможность применения в реальной медицинской практике.

Заключение. Разработанный подход к анализу неструктурированных медицинских текстов с помощью методов машинного обучения является перспективным инструментом для поддержки диагностики заболеваний. Дальнейшие исследования направлены на улучшение интерпретируемости моделей и их адаптацию к различным клиническим источникам данных.

Скачать статью pdf|560,6 КБ

Ермак А.Д., Макарова Е.А., Кафтанов А.Н., Гаврилов Д.В., Новицкий Р.Э., Гусев А.В. Использование методов машинного обучения для диагностики заболеваний на основе неструктурированных медицинских текстов. Национальное здравоохранение. 2025;6(4):55-63. https://doi.org/10.47093/2713-069X.2025.6.4.55-63

Поделиться

Подпишитесь на нашу рассылку

Хотите получать интересную и полезную информацию о цифровом здравоохранении и искусственном интеллекте для медицины?
Включайтесь в нашу рассылку!

Присоединяйтесь

Наши группы в соц сетях