4:00 PM ИИ уменьшает «коммуникационный разрыв» для невербальных людей в два раза |
Исследователи использовали искусственный интеллект, чтобы уменьшить «разрыв в общении» для невербальных людей с двигательными нарушениями, которые полагаются на компьютеры для общения с другими, сообщает forumssity.
Команда из Университета Кембриджа и Университета Данди разработала новый контекстно-зависимый метод, который уменьшает этот разрыв в коммуникации, устраняя от 50% до 96% нажатий клавиш, которые человек должен набирать для общения.
Система специально разработана для невербальных людей и использует ряд контекстных «подсказок» - таких как местоположение пользователя, время суток или личность говорящего партнера пользователя - чтобы помочь в предложении предложений, которые наиболее актуальны для Пользователь.
Невербальные люди с двигательными нарушениями часто используют компьютер с речевым выводом для общения с другими людьми. Однако даже без физической инвалидности, которая влияет на процесс набора текста, эти средства коммуникации слишком медленные и подвержены ошибкам для содержательного разговора: типичная скорость набора текста составляет от пяти до 20 слов в минуту, тогда как типичная скорость речи находится в диапазоне от 100 до 140 слов в минуту.
«Эта разница в скорости передачи данных называется разрывом в коммуникации», - сказал профессор Пер Ола Кристенссон из Кембриджского технического департамента, ведущего автора исследования. «Разрыв обычно составляет от 80 до 135 слов в минуту и влияет на качество повседневного общения людей, которые используют компьютер для общения».
Метод, разработанный Кристенссоном и его коллегами, использует искусственный интеллект, чтобы позволить пользователю быстро находить предложения, которые он набрал в прошлом. Предыдущие исследования показали, что люди, которые, как и все остальные, полагаются на синтез речи, часто используют одни и те же фразы и предложения в повседневной беседе. Однако извлечение этих фраз и предложений является длительным процессом для пользователей существующих технологий синтеза речи, что еще больше замедляет ход разговора.
В новой системе, когда человек печатает, система использует алгоритмы поиска информации для автоматического извлечения наиболее релевантных предыдущих предложений на основе набранного текста и контекста, в котором участвует человек. Контекст включает в себя информацию о разговоре, такую как местоположение, время суток и автоматическая идентификация лица говорящего партнера. Другой динамик идентифицируется с помощью алгоритма компьютерного зрения, обученного распознавать человеческие лица с помощью фронтальной камеры.
Система была разработана с использованием методов конструирования, обычно используемых для реактивных двигателей или медицинских устройств. Исследователи сначала определили критические функции системы, такие как функция автозаполнения слова и функция поиска предложения. После того, как эти функции были определены, исследователи моделировали невербального человека, набирающего большой набор предложений из набора предложений, представляющего тип текста, с которым невербальный человек хотел бы общаться.
Этот анализ позволил исследователям понять лучший метод извлечения предложений и влияние ряда параметров на производительность, таких как точность автозаполнения слова и влияние использования многих тегов контекста. Например, этот анализ показал, что только два достаточно точных тега контекста необходимы для обеспечения большей части выигрыша. Word-auto complete дает положительный вклад, но не является существенным для реализации большей части выигрыша. Предложения извлекаются с использованием алгоритмов поиска информации, аналогичных веб-поиску. Теги контекста добавляются к словам, которые пользователь вводит для формирования запроса.
Это первое исследование, в котором интегрированный контекстно-зависимый поиск информации генерируется с помощью устройств, генерирующих речь, для людей с двигательными нарушениями, демонстрируя, как контекстно-зависимый искусственный интеллект может улучшить жизнь людей с двигательными нарушениями.
«Этот метод дает нам надежду на более инновационные системы с искусственным интеллектом, чтобы помочь людям с двигательными нарушениями общаться в будущем», - сказала Кристенссон. «Мы показали, что можно сократить издержки, связанные с отсутствием инновационных исследований с использованием пользовательских интерфейсов с искусственным интеллектом, которые бросают вызов традиционным мантрам и процессам проектирования пользовательских интерфейсов».
Эта исследовательская работа была опубликована на CHI 2020, ведущей в мире конференции по исследованию взаимодействия между компьютером и человеком.
Исследование финансировалось Советом по инженерным и физическим наукам.
Всего комментариев: 0 | |