Ваш браузер устарел, поэтому сайт может отображаться некорректно. Обновите ваш браузер для повышения уровня безопасности, скорости и комфорта использования этого сайта.
Обновить браузер

О чем говорят собаки: ученые смогли расшифровать лай и рычание с помощью ИИ

Оказалось, что искусственный интеллект вполне может распознать по лаю породу собаки и контекст ситуации, в которой оказалось животное.

28 июня 20244
собака
Источник:

iStockphoto

Владельцы собак подтвердят: братья наши меньшие как будто все понимают, только сказать по-человечески ничего не могут. А теперь представьте, что можете понять речь своего любимца и выяснить, чего он хочет. Кажется, благодаря современным технологиям мы все ближе к этому.

Расшифровать собачий лай смогли ученые из Мичиганского университета вместе с учеными Национального института астрофизики, оптики и электроники в Мексике.

Результаты своего исследования они представили в рамках Объединенной международной конференции по вычислительной лингвистике, языковым ресурсам и оценке.

Что хотели сделать ученые

Авторы работы использовали возможности искусственного интеллекта. С помощью моделей нейросети ученые интерпретировали различные звуки собак.

Для анализа собрали информацию о лае 74 собак в возрасте от 5 месяцев до 7 лет. В эксперименте участвовали представители разных пород: чихуахуа, французские пудели, шнауцеры. Все записи выполнили в естественной домашней обстановке, чтобы звуки и реакции были естественными.

Также авторы исследования специально подвергли животных действию разных стимулов, чтобы получить от них разные звуки. Это были, например, ситуации вроде прихода незнакомца, игры или имитации нападения на хозяина. Происходящее записали на камеру, однако для анализа использовали только звук.

После этого все аудиодорожки поделили на отрезки длиной от 0,3 до 5 секунд. А потом все записи были вручную аннотированы в зависимости от контекста. В итоге все фрагменты разделили на 14 типов звуков: от агрессивного лая на незнакомца до игривого лая во время игры с хозяином.

Для дальнейшего анализа эксперты использовали модель ИИ Wav2Vec2, которую создали для распознавания речи людей. Модель доработали с помощью данных собачьих звуков.

Искусственному интеллекту дали ряд задач:

  • определить, кто конкретно из собак лаял;

  • определить породу пса по его вокализации;

  • распознать пол собаки;

  • привязать звук к конкретной ситуации.

Результаты

Модель прекрасно справилась с поставленными задачами, она достигла практически 50%-й точности.

  • Предварительно обученная модель смогла определить породу лаявшей собаки в 62% случаев. Как отмечают авторы работы, это значит, что у разных пород действительно есть отличительные вокальные характеристики и искусственный интеллект может замечать их так же, как определяет акцент в речи человека.

  • А вот определить пол по лаю ИИ удавалось с трудом. По всей видимости, «голос» у самцов и самок отличается не так сильно или эти отличия слишком сложны для того, чтобы модель смогла их определить.

  • Зато с задачей по определению контекста все получилось. Модель определяла разные типы собак и отличала агрессивный лай от обычного или игривого.

Нюансы

Впрочем, важно отметить, что у исследования были свои ограничения. Пород собак было отобрано не так много, поэтому выборка получилась несколько однобокой. Также авторы работы использовали лишь одну архитектуру ИИ.

Кроме того, в исследовании участвовали исключительно домашние животные. В дальнейшем следует включить более широкий спектр собак и включить в эксперимент звуки и других видов.