Группа ученых, под руководством профессора Ли Хай из Хэфэйского Института здравоохранения и медицинских технологий Китайской академии наук, провела разработку новой платформы глубокого обучения, которая позволяет более точно интерпретировать выявляемые нарушения речи, характерные для определенного неврологического состояния.
Как считает профессор Ли хай, небольшие изменения в речи могут быть не обычной оговоркой, а предупреждающим сигналом мозга. Разработанная учеными модель позволяет выявить ранние признаки таких заболеваний, как болезнь Вильсона, болезнь Хантигтона, болезнь Паркинсона с помощью анализа записи речи.
Результаты исследования недавно были опубликованы в журнале Neurocomputing.
Одним из ранних симптомов различных неврологических заболеваний является дизартрия. С учетом того, что такие нарушения речи часто являются отражением скрытых нейродегенеративных процессов, они могут стать перспективными неинвазивными биомаркерами для проведения скрининга на ранних стадиях и непрерывного мониторинга таких состояний. С помощью автоматизированного анализа речи можно обеспечить неинвазивность и хорошую эффективность диагностики.
Существующие методы анализа речи имеют чрезмерную зависимость от вручную создаваемых признаков, ограничены возможностями моделирования взаимодействия временных переменных и имеют низкую интерпретируемость.
Для решения этих недостатков ученые решили использовать интерактивный преобразователь Cross-Time and Cross-Axis (CTCAIT), который позволяет проводить многомерный анализ временных рядов. Эта система извлекает многомерные временные признаки из речи с помощью крупномасштабной аудиомодели, представляя их в виде многомерных вложений вдоль осей времени и признаков.
В дальнейшем аналитическая система с помощью сети Inception Time захватывает многомасштабные и многоуровневые паттерны во временных рядах. С помощью интеграции механизмов кросс-временного и кросс-канального многоголового внимания, система CTCAIT проводит эффективную фиксацию патологических речевых сигнатур, встроенных в различные измерения. Точность выявления нарушений речи с помощью системы составила 92,06%.
Проведенное исследование планируется использовать в клинической практике, как метод для проведения ранней диагностики и мониторинга неврологических заболеваний.