Транскрибация совещаний с ИИ: настройка за один день
Как автоматически транскрибировать совещания в Zoom и Google Meet с помощью Whisper, суммаризировать итоги и сохранять их в Notion — пошаговый workflow для команды.
Каждое совещание — это решения, задачи и договорённости, которые через час исчезают из памяти половины участников. Транскрибация совещаний с ИИ решает эту проблему радикально: система слушает звонок, превращает речь в текст, извлекает итоги и кладёт их в Notion ещё до того, как вы закрыли ноутбук. В этой статье — конкретный workflow для команды на базе Zoom или Google Meet, OpenAI Whisper и n8n.
Что такое транскрибация совещаний с ИИ
Транскрибация совещаний с ИИ — это автоматический процесс, при котором аудиозапись или видеозапись встречи конвертируется в структурированный текстовый документ с разбивкой по спикерам, временным меткам и выделенными ключевыми решениями. Это не просто субтитры: современные системы дополнительно суммаризируют содержание, формируют список задач и отправляют всё это в рабочее пространство команды без участия человека.
Из каких блоков строится workflow
Стек, который мы используем на проектах, состоит из четырёх звеньев. Каждое можно заменить на альтернативу — главное сохранить логику цепочки.
- Источник записи: Zoom Cloud Recording или Google Meet с записью на Google Drive — оба умеют автоматически сохранять MP4/M4A после созвона.
- Транскрипция: OpenAI Whisper (self-hosted или через API) — распознаёт русский язык с точностью выше 95% при качественном аудио.
- Суммаризация: GPT-4o или Claude 3.5 Sonnet через API — извлекает итоги, задачи, ответственных и дедлайны из сырого транскрипта.
- Хранилище: Notion — создаёт страницу совещания с полным транскриптом, кратким резюме и чеклистом задач.
- Оркестратор: n8n (self-hosted) или Make — связывает все блоки в единую автоматизацию.
Шаг 1 — настройка источника записи
В Zoom включите «Облачную запись» в настройках аккаунта: Admin → Recording → Cloud Recording. После окончания встречи Zoom автоматически загрузит MP4 и отправит вебхук на ваш n8n-сервер. В Google Meet запись сохраняется на Google Drive организатора; триггером служит событие Drive «Файл создан» — n8n слушает его через Google Drive Trigger-ноду.
Важный нюанс: для Whisper нужен аудиофайл, а не видео. В n8n добавьте Execute Command-ноду с ffmpeg: «ffmpeg -i input.mp4 -vn -ar 16000 -ac 1 output.wav». Это снижает размер файла в 10 раз и ускоряет транскрипцию.
Шаг 2 — транскрипция через Whisper
Если бюджет ограничен, используйте whisper.cpp на собственном сервере — модель medium справляется с часовым совещанием за 4–6 минут на CPU. Для командного масштаба (более 10 созвонов в день) проще и дешевле взять OpenAI Whisper API: стоимость транскрипции часового звонка — около 0,36 USD. В n8n это HTTP Request-нода с multipart/form-data, где вы передаёте аудиофайл и параметр language=«ru».
Whisper возвращает JSON с полями text (сырой текст) и segments (фрагменты со временными метками). Segments пригодятся позже, если захотите добавить тайм-коды в Notion.
Шаг 3 — суммаризация и извлечение задач
Сырой транскрипт часового совещания — это 6 000–10 000 слов. Передавайте его в LLM с чётким промптом. Мы используем такой шаблон:
«Ты — помощник для обработки деловых встреч. На основе транскрипта создай: 1) краткое резюме до 200 слов, 2) список принятых решений, 3) список задач в формате «Задача — Ответственный — Дедлайн». Если дедлайн не назван явно, поставь пометку «уточнить». Отвечай строго в JSON.»
Модель возвращает структурированный JSON, который n8n разбирает и передаёт дальше. Если совещание длиннее 2 часов, разбивайте транскрипт на чанки по 4 000 токенов с перекрытием 200 токенов — иначе контекст будет потерян.
Шаг 4 — создание страницы в Notion
В n8n используйте Notion-ноду «Create Page» в базе данных совещаний. Структура страницы: заголовок (название звонка + дата), свойства (участники, длительность, статус обработки), три блока контента — резюме, решения, задачи как Notion To-Do с чекбоксами. Полный транскрипт выносите в раскрывающийся блок Toggle, чтобы не перегружать интерфейс.
Добавьте финальный шаг: Notion-нода «Create Database Item» для каждой задачи из списка — так задачи попадут в отдельную базу задач и будут связаны со страницей совещания через Relation.
Кейс: команда продаж, 12 менеджеров
К нам обратилась компания с командой из 12 менеджеров по продажам. Еженедельно — 3 командных созвона и около 40 клиентских звонков. Проблема: итоги фиксировались вручную в разных форматах, задачи терялись, на ввод данных уходило 2–3 часа в неделю на каждого менеджера.
Мы настроили workflow: Zoom Cloud Recording → n8n → Whisper API → GPT-4o → Notion. Время от окончания звонка до готовой страницы в Notion — 3–5 минут. После запуска: время на фиксацию итогов сократилось с 2,5 часов до 15 минут в неделю на сотрудника (−90%), количество «потерянных» задач за первый месяц — 0 против 12–15 в предыдущий период. Стоимость инфраструктуры — около 80 USD/месяц при объёме 400+ часов звонков.
Где ИИ-транскрипция не окупается
Честно: если у вас 1–2 коротких созвона в неделю, настраивать полный pipeline нецелесообразно — проще использовать готовый сервис вроде Otter.ai или Fireflies.ai с бесплатным тарифом. Автоматизация через n8n + Whisper начинает окупаться от 20+ записей в неделю или когда нужна глубокая интеграция с внутренними системами (CRM, трекер задач, база знаний).
Итог
Транскрибация совещаний с ИИ — это не инструмент для экономии на секретарях. Это способ превратить каждый звонок в актив: структурированные данные, которые попадают в нужное место без участия человека. Workflow на базе Whisper + LLM + n8n + Notion собирается за один рабочий день и начинает работать немедленно. Если хотите разобрать, как встроить это в вашу инфраструктуру — мы готовы.
Посмотреть наши продукты