Создание
В разделе «AI-агент» вкладка «Настройки агента» меню слева «Все агенты» вкладка «Настройки агента»:
Нажмите кнопку «Создать агента».
Укажите имя агента.
Нажмите кнопку «Сохранить».
Агент создан.
Настройка
Откройте настройки агента, нажав на сам блок или меню из трёх точек в нём.
Заполните поля или выберите из выпадающих списков:
Вкладка Общие настройки:
Название — уникальное имя агента для идентификации в системе.
Модель — модель ИИ, определяющий интеллект и возможности агента:
- gpt-4o-realtime-preview — Флагманская модель для задач премиум-класса с максимальной точностью и минимальной задержкой.
- gpt-4o-mini-realtime-preview — Оптимизированная версия для баланса скорости и стоимости, подходит для большинства задач.
Голос — генерация речи с уникальными характеристиками::
- alloy — Нейтральный технологичный тембр,
- ash — Мягкий спокойный голос,
- ballad — Выразительный мелодичный тембр,
- coral — Яркий энергичный голос,
- echo — Четкий дикторский тембр,
- sage — Спокойный уверенный голос,
- shimmer — Легкий воздушный тембр,
- verse — Риторический выразительный голос.
Промпт — Системная инструкция, определяющая роль, поведение и стиль общения AI агента.
Вкладка Дополнительные настройки:
Роль первого сообщения — выберите, от чьего имени будет составлено самое первое сообщение в диалоге с пользователем .
- User (пользователь): Сообщение будет имитировать реплику человека, обращающегося к агенту.
- System (система): Сообщение содержит инструкции для самого агента. Это самый важный параметр. Здесь задается роль агента (например, "Ты - дружелюбный помощник службы поддержки интернет-магазина"), его основные задачи, правила поведения и стиль общения. Это "мета-указание", которое агент будет помнить в течение всего диалога.
- Agent (агент): Сообщение является первым ответом самого AI-агента. Это используется, чтобы сразу начать диалог с определенной фразы (например, "Здравствуйте! Чем я могу вам помочь?").
Текст первого сообщения — текст, который будет использован в зависимости от выбранной Роли первого сообщения.
Скорость — скорости ответа в интерфейсе пользователя.
Температура — параметр, контролирующий случайность и креативность ответов. От 0 до 1, рекомендуемое — 0,7.
Настройки детекции речи:
- Тип детекции речи— Алгоритм определения начала и конца речи (например, на основе энергии звука или ML-модели).
- server_vad — режим, при котором обработка аудио происходит на сервере.
- Задержка перед началом (мс) — Время ожидания после первого звука, чтобы убедиться, что это речь, а не случайный шум.
- Порог чувствительности — Уровень громкости, при превышении которого звук считается речью. Чем выше, тем меньше ложных срабатываний на шум.
- Длительность тишины (мс) — Время непрерывного молчания, после которого диалог считается завершенным.
- Создавать ответ автоматически — Если включено, AI начнет генерировать ответ сразу после детектирования конца речи пользователя, без дополнительных команд.
- Тип детекции речи— Алгоритм определения начала и конца речи (например, на основе энергии звука или ML-модели).
Распознавание речи:
- Модель— выбор алгоритма для преобразования голоса в текст. От модели зависят скорость и точность.
- gpt-4o-transcribe — модель от OpenAI на базе GPT-4o. Высшая точность и понимание контекста. Лучше всего справляется с сложным audio (акценты, шумы, спецтермины). Самая продвинутая модель.
- gpt-4o-mini-transcribe — облегченная и более быстрая версия на базе GPT-4o Mini. Оптимальна для большинства стандартных задач. Хорошее соотношение скорости, стоимости и качества.
- whisper-1 — классическая open-source модель от OpenAI. Универсальная работа, хорошее качество для многих языков.
- Промт — системный промт или контекст для улучшения распознавания.
- Язык — язык, на котором ожидается речь пользователя (
ru
,en
,auto
).
- Модель— выбор алгоритма для преобразования голоса в текст. От модели зависят скорость и точность.
Шумоподавление:
- Тип шумоподавления— алгоритм фильтрации фоновых шумов.
- Ближняя зона (near field) — для тихой обстановки и близко расположенного микрофона (например, колл-центр).
- Дальняя зона (far field) — для шумных помещений и удаленного микрофона (например, умная колонка в комнате). Агрессивнее подавляет шумы.
- Тип шумоподавления— алгоритм фильтрации фоновых шумов.
Вкладка Функции — добавьте функции, созданные в разделе «AI-агент» на вкладке «Функции». Подробнее см. «Функции AI агента».
После заполнения нажмите кнопку «Сохранить».
Также см.:
Статья помогла?
Отлично!
Спасибо за ваш отзыв
Извините, что не удалось помочь!
Спасибо за ваш отзыв
Комментарий отправлен
Мы ценим вашу помощь и постараемся исправить статью