Такие данные, как анамнезы, результаты осмотров, описания результатов обследований (УЗИ, ЭКГ, рентген) и другие, имеют неструктурированную форму (в виде текстов на естественном языке). <...> Используя методы интеллектуальной обработки накопленных массивов данных, можно автоматизировать решение многих задач, возникающих в клинической практике, повысив таким образом качество медицинской помощи. <...> Цель исследования: создание комплексной системы интеллектуальной обработки данных в многопрофильном педиатрическом центре. <...> Извлечение информации из клинических текстов на русском языке осуществляется на основе их полного лингвистического анализа. <...> Из текстов извлекаются названия заболеваний, симптомов, областей тела, к которым относится заболевание, а также лекарственных препаратов. <...> В тексте распознаются такие атрибуты заболеваний, как «отрицание» (указывает на то, что заболевание отсутствует), «не пациент» (указывает на то, что заболевание относится не к пациенту, а к его родственнику), «тяжесть заболевания», «течение заболевания». <...> Для извлечения информации применяют медицинские тезаурусы, набор вручную составленных шаблонов, а также различные методы на основе машинного обучения. <...> Полученные из текстов данные используются для решения задачи автоматической диагностики хронических заболеваний. <...> Предложен метод на основе машинного обучения для классификации пациентов со схожими нозологиями, а также метод для определения наиболее информативных признаков. <...> Экспериментальное исследование разработанных методов проводилось на обезличенных историях болезни пациентов педиатрического центра. <...> Проведена экспериментальная оценка метода автоматической диагностики для пациентов с болезнями органов дыхания, с аллергическими, нефрологическими и ревматическими болезнями. <...> Определены наиболее информативные признаки, а также подходящие методы машинного обучения для классификации пациентов по группам <...>