От RAG для операторов до RAG-платформы для крупного банка

ML/AI

Сложность -

Презентация pdf

Что такое RAG и чем отличается от дообучения архитектура нашего решения, гипотезы.

Какие LLM модели используем, что сравнивали.
Какие показатели сейчас (пользователи, RPS, время ответа, какое железо).
Как мы измеряем качество ответов.
Где что-то не получилось.
Масштабирование на 6 тысяч операторов.
Планы, связанные с платформой и self-сервисом.

Спикеры

Марк Кузнецов
Альфа-Банк
Алексей Фатеев
Альфа-Банк

Другие доклады по теме «ML/AI»
- Смотреть запись
  Битва кодовых ассистентов. Эффективность, безопасность и стоимость
  Антон Черноусов
  Yandex Cloud
  Александр Кириллов
  Evrone
  1 залСложность -
- Смотреть запись
  Идеальная «песочница» для ML-моделей: настраиваем контейнеризацию без стресса
  Даниил Салман
  K2 Тех
  1 залСложность -
- Смотреть запись
  Как выжать максимум из GPU и Ray: наш боевой ML-инфраструктурный пайплайн
  Михаил Унтура
  Orion soft
  1 залСложность -
- Смотреть запись
  GPU-инференс в K8s: ускорение, шеринг и скейлинг без боли
  Антон Алексеев
  Авито
  2 залСложность -
- Смотреть запись
  n8n + AI для DevOps-процессов
  Евгений Дехтярев
  2ГИС
  3 залСложность -
- Смотреть запись
  Ломай меня полностью: как ИИ (не) помогает делать пентест
  Виктор Чаплыгин
  Авенир Воронов
  КОРУС Консалтинг
  Константин Дипеж
  DeusOps
  Сложность -
- Смотреть запись
  ИИ в SDLC
  Авенир Воронов
  КОРУС Консалтинг
  Илья Атарщиков
  КОРУС Консалтинг
  2 зал

Расписание

От RAG для операторов до RAG-платформы для крупного банка

Спикеры

Другие доклады по теме «ML/AI»