создать навык для алисы конструктор

Как создать навык для Алисы?

laptopmockup verter

Возможности конструктора Вертер

Вопросы-Ответы

Навык работает эффективно, если пользователи получают нужные ответы на заданные вопросы. Сервис Вертер позволяет добавлять различные ответы и подсказки к любому навыку.

Screen Shot 2018 05

Формы

Диалоги

Все сообщения пользователей логируются вместе с выданными помощником ответами, что создает благоприятную базу для последующего анализа.

Screen Shot 2018 05

Screen Shot 2018 05

Обучение

История запросов пользователей позволяет сформировать наиболее релевантные ответы и добавить их к навыку, а также привязать вопросы к готовым ответам.

Алиса – виртуальный голосовой помощник, созданный командой разработчиков «Яндекс» в 2017 году.

Она способна распознавать устную и письменную речь, давать ответы на вопросы вслух и в чате, вести диалог, шутить, запускать полезные сервисы, давать советы и др. Сервис работает в приложениях «Яндекс» и «Яндекс.Браузер» для iOS и Android, а также в версии браузера для Windows.

Какие задачи помогает решить голосовой помощник? Алиса умеет не только вести диалог с пользователем, но также предоставлять сведения о погоде и курсах валют, искать информацию в сети, формировать маршруты, заказывать цветы и пиццу, формировать планы и списки покупок, играть, давать советы.

В 2018 году спектр действий, выполняемых голосовым помощником существенно расширился: ныне Алиса способна выполнять более 200 команд. Все потому что 13 марта Яндекс создал для пользователей возможность разработки и добавления навыков сервиса.

Навык Алисы – полезная команда, которая запускает Яндекс.Поиск, Яндекс.Карты, Яндекс.Погоду или сторонние сервисы.

Навыки делают взаимодействие с помощником весьма продуктивным: на их основе можно заказать доставку еды или цветов на дом, найти эвакуатор, получить совет риелтора, узнать расписание движения автобусов и др.

Запустить навык может только пользователь при помощи специальной активационной фразы, вроде «Запусти поиска автобусов в Москве» или «Открой мой ежедневник». Автоматически навыки не запускаются. По окончании использования навыка пользователь должен сказать: «Алиса, хватит», после чего можно запускать другой навык.

После того, как веб-программист создаёт и размещает новый навык для Алисы на платформе Яндекс.Диалоги он не сразу становится доступным широкому кругу пользователей – первоначально его проверяют модераторы. Публичными становятся только те навыки, которые попали в каталог Яндекса

Воспользоваться навыками Алисы можно в любом продукте Яндекс где есть текстовый ввод.

Сервис доступен бесплатно потому, что мы хотим завоевать доверие к нашему основному продукту прежде чем предлагать платные функции.

При необходимости мы можем предложить расширенную платную поддержку и нестандартный функционал.

Источник

Как создать навык для Алисы с нуля

От написания сценария до публикации

С помощью голосового помощника Яндекса уже можно узнавать погоду, строить маршруты и управлять умным домом. Но возможности Алисы можно еще расширить: например, создать навык для заказа еды или игру-квест по управлению государством. Навык может создать и опубликовать любой пользователь с помощью платформы Яндекс.Диалоги. Чтобы это сделать, нужно придумать идею, написать сценарий и код (если вы не умеете программировать, то можно воспользоваться визуальным конструктором). Академия Яндекса разобралась, как пройти путь от задумки до публикации навыка.

Как понять, какой навык делать

«Преимущество голосовых интерфейсов в простоте взаимодействия с ними», — рассказывает консультант Алисы Мика Голубовский. К тому же у пользователей часто появляется эмоциональная связь с голосовым ассистентом: они то пробуют подколоть Алису, то интересуются, как прошёл её день. Но для того, чтобы пользователи могли естественно использовать навыки, разработчикам навыков нужно приложить специальные усилия.

Навык — это новый способ оказания услуги: он не должен совпадать с тем, что и так уже есть на сайте или в приложении. Во-первых, визуальный интерфейс плохо переводится в голосовой, а во-вторых, такой навык не будет интересен пользователям. Например, для авиакомпании будет уместным заменить привычный инструмент для покупки билетов игрой. Так, можно внедрить в навык игру в города и иногда добавлять к репликам Алисы цены на билет в названный город. Или сделать отдельный навык для покупки горящих билетов, который будет выдавать пользователю случайные направления.

Плохой пример переноса функции в голосовой интерфейс, пользователю сложно воспринимать объёмные сообщения на слух:

Хороший пример переноса функции в голосовой интерфейс:

В голосовой интерфейс просто перевести любую систему ответов на часто задаваемые вопросы (FAQ). Однако для того, чтобы таким навыком массово пользовались, нужен интересный большой аудитории предмет навыка. Но часто возвращаться в такой навык пользователи всё равно не будут.

Так, Яндекс выпустил два навыка для игры «Detroit: Стать человеком». К её выходу компания опубликовала навык «Игра Detroit», который отвечал на вопросы пользователей, показывал интервью с создателями и рассказывал необычные факты о игре. Следом за ним Яндекс выпустил голосовой квест по мотивам игры («Квест Detroit»): сейчас им пользуется втрое больше людей, чем FAQ. Помимо того, что квесты используют чаще, пользователи проводят в них больше времени, чем в неигровых навыках: в среднем 15–18 минут подряд.

Для того, чтобы улучшить функциональность, можно использовать не только свои идеи, но и отзывы пользователей или других разработчиков — у создателей навыков для Алисы есть специальный чат в Telegram.

Из чего состоят навыки

У навыков для Алисы есть три составляющих: сценарий, контент (данные, к которым обращается навык) и код. Сценарий описывает фразы, которые может произносить пользователь, и то, как навык будет на них реагировать. Для того, чтобы понять, как будет идти диалог, можно сначала нарисовать простую схему на листе бумаги. «Для создания сценария удобно использовать визуальные конструкторы: например, AImylogic. С помощью конструктора можно увидеть, как будут работать переходы в диалоге, и протестировать навык», — советует призёр Премии Алисы Дмитрий Чечёткин.

Читайте также:  искендеров ильгар фазиль оглы биография

Как написать хороший сценарий

Правильно начать

Главные слова в навыке — это приветственная фраза. От того, насколько хорошо она составлена, зависит, будут ли пользователи пользоваться вашим навыком. Люди не привыкли к голосовым интерфейсам и ждут от них естественного общения. Поэтому важно с самого начала направить их в нужном направлении.

В первой реплике нужно объяснить, что навык умеет: например, если это игра, то описать её правила. Ещё в первом сообщении важно проговорить пользователю, что именно ему нужно делать. Закончить фразу лучше вопросом, который будет побуждать пользователя к действию. Например, так:

Однако не стоит добавлять в приветственную фразу слишком много подробностей: хорошая реплика должна произноситься на одном дыхании. Это правило действует и для других реплик Алисы: если перегрузить пользователя информацией, то он её сразу же забудет.

Выбрать тон

Ещё одна задача первой реплики — задать тон общения с пользователем. Навык — это персонаж, и у него может быть разный характер в зависимости от задачи. Так, навыку для пенсионного фонда следует обращаться к пользователям официально, а детской игре, наоборот, весело и неформально.

Любой стиль общения стоит выбирать осознанно: от «характера» навыка зависит то, какие команды ждать от пользователя. Например, если стиль общения свободный, то для утвердительных ответов пользователя нужно предусмотреть не только «да», но и «ага». А если у навыка военная тематика, то можно добавить и вариант «так точно».

Направлять пользователей

Пользователей навыка можно направлять при помощи вопросов. При этом важно предлагать пользователю конкретные варианты ответа, из которых он может выбрать, чтобы не запутывать его сильнее.

Добавить вариативности

Если какой-то тип ответа используется в вашем навыке часто, то стоит прописать для него несколько эквивалентных вариантов. Чем разнообразнее будут реплики, тем больше общение с Алисой будет похоже на настоящий разговор.

Как написать код

Технически навык очень похож на бота, но с тем отличием, что он не может сам отправлять сообщения — только отвечать на запросы пользователя. Для того, чтобы запустить навык, нужно подготовить исходный код (например, на Python или на Node.js) и развернуть веб-сервис.

Для развёртывания навыка можно использовать сервис Now: он позволяет быстро запустить нужное веб-приложение, но ограничивает удобство разработки и тестирования. А чтобы запустить сервис в условиях, приближенных к боевым, можно воспользоваться Microsoft Azure, Amazon Web Services или Яндекс.Облаком. Так, Облако выдаёт всем создателям навыков гранты на использование сервиса.

Если вы не умеете программировать, то вместо написания кода можно воспользоваться визуальными конструкторами, например: Aimylogic, Dialogflow, Verter, AlfaBot, AlicePro или PipeBot.

При выборе конструктора стоит обратить внимание на реализацию в нём обработки естественного языка. От неё зависит, будет ли навык реагировать на разные формулировки одного и того же запроса: например, «хочу пиццу», «закажи пиццу» и «сделай заказ».

Кроме того, важно качество интеграции навыка с Яндекс.Диалогами: возможность создания подсказок, адаптации навыка для разных устройств (смартфонов, Станции, Навигатора) и добавления картинок и звуков.

Работа в Яндекс.Диалогах

Для того, чтобы создать навык, нужно зарегистрироваться на сайте конструктора и на платформе Яндекс.Диалоги. В Яндекс.Диалогах необходимо добавить диалог с помощью кнопки и выбрать его тип — навык для Алисы.

На странице диалога будет его идентификатор: его нужно скопировать в конструктор, чтобы затем импортировать из него алгоритм.

Работа в конструкторе

С помощью визуальных конструкторов можно создавать деревья, которые соответствуют ходу диалога. А переход по ветвям зависит от того, как пользователь будет реагировать на действия навыка.

Пример реализации навыка на платформе Aimylogic

В навыки можно добавлять кнопки для того, чтобы пользователь мог задавать простые команды не голосом, а быстрым нажатием (например, в отдельную кнопку обычно выносят команду «помощь»).

Ещё в конструкторах используется метод «HTTP-запрос». С его помощью конструктор может получать данные из внешних источников: например, облачных хранилищ или таблиц. Контент для навыка можно хранить и внутри конструктора, но это усложнит архитектуру диалога и его редактирование — поэтому так делать не стоит.

Пример таблицы с информацией для навыка: вопросами, которые будет задавать Алиса, и вариантами ответов, которые может давать пользователь

В записях Школы Алисы можно посмотреть подробные инструкции по использованию конструкторов навыков: по работе с Aimylogic и DialogFlower.

Как опубликовать навык

Для того, чтобы навык можно было использовать любому пользователю, его нужно разместить в каталоге. Чтобы опубликовать диалог, его нужно зарегистрировать в консоли разработчика.

Сперва понадобится задать настройки навыка: название, URL, фразы, активирующие навык, и голос, который он может использовать.

Название навыка для каталога должно состоять не менее чем из двух слов, быть написанным на русском или английском языке и не ограничиваться общей категорией («пластиковые окна» или «путешествия» не подходят). Также имя должно быть уникальным и не содержать слов «Алиса», «Яндекс» или «Станция».

Активационное имя — это фраза, по которой навык можно вызвать в разговоре с Алисой. В этой фразе должна содержаться сокращённая или развёрнутая форма названия: так, для навыка «Верю — не верю» можно использовать имя «играть в верю — не верю».

Голос для озвучивания навыка можно выбрать из специального списка: в него включен как привычный голос Алисы, так и более необычные, например, Эркан Явас — голос, которым озвучиваются Яндекс.Новости.

Ещё перед проверкой нужно выбрать устройства, которые будут поддерживать работу навыка (чтобы модераторы проверили его на всех из них), и протестировать ответы навыка на его странице в личном кабинете.

После того, как вы отправите навык на проверку, результат модерации появится в личном кабинете в течение трех дней. Если навык одобрят, то его можно будет отправить на публикацию кнопкой «опубликовать». А в каталоге навыков Алисы он появится спустя 5–10 минут.

Читайте также:  когда возникла письменность на руси

Источник

Разработка навыков для Алисы. Опыт работы с голосовыми интерфейсами, советы начинающим

Всего месяц назад мы захотели попробовать себя в создании расширения для функционала Алисы — навыков. По опыту общения в чате поддержки Яндекс Диалогов сложилось впечатление что уже есть, чем поделиться с начинающими особенностями работы над голосовыми интерфейсами.

В заметке хочу рассказать свои впечатления от трех недель работы нашего детского новогоднего навыка Снегурочки и о вопросах и ответах в чате разработчиков диалогов.

kxf1cmoa9bveefkp5e rvq8gd7q

Для профессионала в VUI в заметке не будет ничего нового, но дельные советы и комментарии от опытных приветствуются. Пишу впервые, прошу не судить строго.

Почему стоит обратить внимание на Алису?

Если за рубежом голосовые помощники уже стали обыденностью, многочасовые разговоры с роботом уже утекают в сеть, то у нас это пока остается на уровне взаимодействия с навигатором, болтовни детей с Алисой, баловством гиков с умными домами. Мало кто из моих знакомых заносит заметки и напоминания с помощью Siri, хотя, на мой взгляд — это один из самых удобных вариантов ее использования. С большой вероятностью в наступающем году эта ситуация изменится в лучшую сторону, ведь фундамент уже заложен:

Зачем все это: голос, навыки?

Думаю, многим уже понятно преимущество голосовых интерфейсов в некоторых случаях, но не лишним будет напомнить: иногда это самый подходящий вариант. Например, в автомобиле или на кухне занимаясь приготовлением еды, при любой другой деятельности, где руки заняты, удобнее отдавать команды голосом. Например, уже давно есть роботы-медсестры, управляемые голосом, помогающие при хирургических операциях.

Голос — привычный людям интерфейс взаимодействия. Пожилые люди и дети без особых проблем осваивают этот метод для получения информации и управления гаджетами.

Для людей с нарушением зрения голос и слух — являются еще более важным каналом взаимодействия с окружающей средой. Судя по чату Яндекс.Станции такая категория людей очень оценила появление такого устройства, облегчающего их жизнь.

Продолжать перечислять кейсы не буду, если интересно, то можно детальнее узнать обо всем этом из специальной литературы.

Навык — это программа реализующая некий диалог, который запускается заданной командой активации в Алисе и расширяющий возможности голосового помощника от Яндекса.

Как создать навык?

Есть уже некоторое количество хороших сторонних навыков, но еще много ниш, которые можно занять и сделать по-настоящему интересный и полезный навык.

По созданию их есть несколько статей, в том числе и на Хабре. Есть документация, есть краткие общие рекомендации. Не стану сильно углубляться в технические детали реализации, т.к. хотелось бы поделиться общими подходами для начинающих.

Технически навык очень похож на бота, с тем отличием, что он не может сам отправить сообщение, а только ответить на запрос пользователя.

Вот небольшой список ресурсов которые помогут начать:Библиотеки и ресурсы для Яндекс Диалогов

Неофициальный FAQ по работе с Яндекс Диалогами.

В документе собраны актуальные и не очень ссылки и вопросы-ответы.
Вышеупомянутый чат Яндекс Диалогов.

Для начала разработки нужен аккаунт на Яндексе, сервер, на котором будет находиться и выполняться код нашей программы, вебсервер и само приложение, написанное на любом удобном вам языке, который сможет обеспечить работу по https протоколу.

Детали реализации своих навыков я тут приводить не буду, если будет запрос от сообщества, то уделю этому внимание в отдельной статье. Тем более что подобные материалы уже есть.

Оставлю только пример простого навыка на PHP с комментариями который, думаю, позволит сделать быстрый старт новичку.

В репозитории находится скрипт для создания простой среды для разработки, который запускает встроенный в PHP вебсервер и используя сервис serveo.net делает локальный порт доступным из интернет:

image loader

Сохраняем урл https://******.serveo.net — это будет урл вашего вебхука. В отличие от ngrok этот урл не изменяется со временем, не надо менять его в настройках диалога. Можете проверить доступность вебхука введя в браузере этот урл — должен вернуться json с ошибкой. Это нормально, мы не передали скрипту необходимых параметров.

Далее регистрируем сам навык по ссылке:

image loader

Выбираем пункт «Навык в Алисе»

image loader

Заполняем все поля согласно подсказкам и документации диалогов:

image loader

В поле webhook url вводим полученный ранее урл.

Пробуем сохранить, если следовали приведенным инструкциям все должно отработать с первого раза.

В данной статье по реализации только посоветую обратить особое внимание системе логирования действий пользователя. Я все проблемные участки взаимодействия пользователя, например, ожидаю «да | нет» а получаю иное, записываю в лог и тут же транслирую (отдельным процессом для скорости работы вебхука) в телеграм-канал для оперативного отслеживания и реагирования.

Общий подход и типичные ошибки.

Как я и предполагал, подходы привычные в обычной веб-разработке или разработке телеграм ботов тут мало подходят. Основное отличие — частая непредсказуемость ответов. Платформа диалогов позволяет добавлять кнопки с четкими ответами на вопрос, но пользователь часто отвечает совсем не то, что ожидает программист, привыкший следовать четкой логике.

Вы хотите выучить еще одно стихотворения?
[да] [нет]

Ожидаем что человек ответит да или нет, но нам приходило много других вариантов:

Если мы просто повторим тот же вопрос, не распознав правильный ответ, то это может раздражать пользователя и приводить к разочарованию в вашем навыке и в голосовых интерфейсах в целом. Потому следует уделять сообщениям об ошибках отдельное внимание, иногда лучше переформулировать вопрос, уточнить его, а не задавать его снова. На тот же самый вопрос пользователь скорее всего ответит то же самое, просто громче.

Так же следует стараться предусмотреть различные варианты ответов пользователя, выделять смысловую часть. В зависимости от ситуации иногда лучше один раз ошибиться в пользу неверного распознавания ответа, а не заставлять пользователя ответить четко. Если в ожидаемые ответы добавить что-то с паттерном (да *), то чаще будет срабатывать так как надо, а случаи, когда нам ответили «да отстань ты уже» будут уже как исключение и ничего критичного в логике программы не произойдет. Если, конечно, нам нужен точный ответ, из-за неверного распознания которого, в системе будут необратимые последствия, то тогда следует добиться от пользователя внятного ответа. Либо в случае если мы не уверены в ответе, то можем спросить дополнительно недостающую информацию.

Читайте также:  навык бармена в симс 4 код

Каждый из случаев взаимодействия следует рассматривать отдельно.

В приведенном выше примере мы столкнулись с тем, что пользователи просят стихотворение покороче или про какого-то персонажа («а есть покороче?», «давай про снегурочку»).

Тут у нас появляются варианты — либо добавлять новые уровни меню, но не забывать о «человечности» диалога или реагировать на такие запросы в соответствии с ожиданиями пользователя, но явно их не предлагая.

Как мы в начале ни продумывали эту диалоговую часть, мы поняли, что реальное использование лучше покажет желания пользователя, потому свой первый навык начали с минимальным функционалом, постепенно добавляя возможности нашей Снегурочки, а также реакции на востребованные, но непредусмотренные нами заранее запросы.

Использование сторонних API

Обратили внимание, что для предоставления в своих навыках каких-то полезных функций, разработчики прибегают порой к чрезмерному использованию сторонних API. Однако не стоит забывать, что время ответа вашего webhook не должно превышать 1,5 секунды. Иногда это может стать причиной отрицательного опыта пользователя с навыком, который то отвечает корректно, то пишет: «что-то пошло не так».

Особенности распознавания именованных сущностей: не все имена, города распознаются корректно, и потому желательно предусмотреть это в своем навыке. Мы пока, чтобы не лишать возможности ребенка с нераспознанным Яндексом именем общаться со Снегурочкой пришлось прибегать к некоторым «костылям». Сразу учитывайте это при разработке, чтобы потом не огорчать пользователей с именами Слава или Надежда, например. Надеемся, Яндекс вскоре это поправит.

Существующий инструмент тестирования синтеза речи не всегда соответсвует тому, что будет у вас в навыке на самом деле. Не ленитесь предусмотреть механизмы добавления tts к любым вашим ответам. Мы понадеялись на движок Яндекса, и часть фраз в нашем навыке теперь уже сложно разметить для более качественного произношения (без больших изменений в коде). Учтем на будущее.

Очень помогли простые, но достаточно эффективные PHP функции для нечеткого сравнения слов:
similar_text(), levenshtein(), в других языках тоже есть подобные инструменты. Ну, и, конечно, регулярные выражения, куда без них.

Эти функции позволили, например, принять корректно ответ на загадку с частично верным ответом — не точно распознанный, в разных склонениях.

Это, конечно, для специалистов по NLP (Обработке естественного языка) будет выглядеть несерьезно, но, повторюсь, заметка — для начинающих.

Текущие недостатки платформы

Кратко обозначу основные претензии разработчиков к Яндекс Диалогам, которые заметил в чате.

Долгая, часто кажущаяся нелогичной, модерация. Бывает, что ваш навык не проходит модерацию по причине того, что у вас, скажем, слишком общее имя навыка, например, «погода в Крыму» при том, что уже есть навык с подобным именем — «Погода в Северодвинске». Так понимаю, что связано это с тем, что раньше требования к именам и активационным словам были проще и сыну маминой подруге тому вот парню повезло, а у вас так уже не получится. Ищите другую фразу или попробуйте использовать бренд.

Не всегда документация соответсвует действительности. Сама платформа развивается быстро, документация не поспевает, трактуется пользователями и представителями яндекса иногда по-разному.

Платформа пока предоставляет лишь базовые средства для дебага навыков.
При добавлении навыка в панель разработчика ваш вебхук уже должен отвечать правильно, или просто произойдет ошибка валидации. Что за ошибка, какой JSON был отправлен и какой пришел — мы не увидим. Если же вам удалось добавить навык, то у вас будет минимальная панель с содержимым лишь последнего запроса-ответа и все! Никаких средств проверить как это будет в реальности работать и звучать на устройстве до модерации нет. Есть сторонний эмулятор, который достаточно нестабильно работает, не во всех браузерах, да и не соответсвует текущему протоколу.

Есть и другие пожелания и запросы от разработчиков, такие как: интеграция с умным домом, определение собеседника по его голосу, возможность выбирать голоса для навыков с более качественной генерацией, интеграция платежных систем, интеграция с Яндекс аккаунтом, в том числе для работы с навыком с разных устройств под одним пользователем, продуманная система приватных навыков. Но это — функции требующие тщательной проработки и, с точки зрения безопасности, удобства. Думаю, Яндекс сможет предоставить эти возможности, когда реализует это на должном уровне. Однако, проблемы с модерацией, дебагом и местами неактуальной документацией могут сильно мешать начинающим освоится в платформе.

Помогает то, что в чате поддержка стабильно отвечает, так же организовалось уже более менее опытное и отзывчивое сообщество, которое очень помогло мне, поможет и вам. На многие претензии поддержка достаточно оперативно реагирует сообщениями «приняли к сведению», «про документацию знаем, исправим», «насчет модерации решаем». Ок, мы ждем с нетерпением.

Для быстрого старта советую опубликовать приватный навык, они сейчас проверяются с минимальными требованиями:

Однажды опубликованный навык можно использовать для тестирования своих других диалогов в ожиданиях модерации путем проксирования запросов с опубликованного вебхука на разрабатываемый, фильтруя по user_id.

Вывод

В целом сами голосовые интерфейсы показались очень интересной темой, все более востребованной в будущем, планирую больше погружаться в нее, читая специальную литературу, инструкции и советы зарубежных аналогичных сервисов (Google, Amazon, Siri, etc.).

Еще раз напомню о яндексовской школе Алисы, если кого-то как и меня заинтересовала эта тематика.

Источник

Поделиться с друзьями
Моря и океаны
Adblock
detector