Парсинг YouTube-каналов с ИИ и сохранение в Airtable
Готовый workflow: парсинг YouTube-каналов с ИИ, транскрибация видео и суммаризация — всё автоматически летит в Airtable. Пошаговый разбор с цифрами.
Парсинг YouTube-каналов с ИИ — это автоматический сбор видео с канала, извлечение транскриптов, суммаризация каждого ролика и сохранение структурированных данных в базу. Звучит как задача для разработчика на пару недель, но мы собираем такой workflow за день с помощью n8n, Whisper и Airtable. Если вы следите за конкурентами, изучаете рынок или хотите превратить чужой контент в базу знаний — этот гайд для вас.
Зачем это нужно бизнесу
Вручную смотреть десятки роликов конкурентов, выписывать тезисы и сортировать по темам — это часы работы аналитика каждую неделю. Маркетологи тратят время на YouTube, а не на выводы из него. Автоматизированный парсинг YouTube-каналов решает проблему иначе: система сама снимает все новые видео, расшифровывает их и кладёт готовое резюме в таблицу. Вы открываете Airtable и видите: что вышло, о чём говорят, какие темы набирают просмотры.
- Конкурентный анализ: отслеживаете, какие продукты и боли они продвигают в роликах
- Контент-исследование: находите незакрытые темы в своей нише
- Мониторинг упоминаний: проверяете, говорят ли о вашем бренде на чужих каналах
- База знаний: накапливаете транскрипты экспертов по своей теме
Архитектура workflow: три блока
Весь процесс парсинга YouTube-каналов с ИИ делится на три последовательных блока. Первый — сбор: достаём список новых видео с нужных каналов через YouTube Data API. Второй — обработка: скачиваем аудио, прогоняем через Whisper для транскрибации, затем Claude или GPT-4o делает краткое резюме и выделяет ключевые тезисы. Третий — хранение: структурированные данные (заголовок, дата, ссылка, резюме, теги, количество просмотров) записываются в Airtable через API.
Шаг 1. Получаем список видео через YouTube Data API
YouTube Data API v3 отдаёт плейлист загрузок канала по его ID. В n8n это один HTTP Request-узел: передаёте channelId, получаете массив видео с метаданными. Бесплатная квота — 10 000 единиц в день, один запрос стоит 1–100 единиц, так что для мониторинга 5–10 каналов лимит не помеха. Фильтруем по дате публикации, чтобы не обрабатывать одно и то же дважды — для этого в Airtable ведём поле «Обработано».
Шаг 2. Транскрибация аудио через Whisper
Для транскрибации нужен аудиофайл. Используем yt-dlp — утилиту, которую запускаем через Execute Command в n8n. Она скачивает аудиодорожку в mp3 за несколько секунд. Дальше файл идёт в OpenAI Whisper API: стоимость около 0,006 $ за минуту аудио. Десятиминутный ролик обходится в 6 центов. Whisper возвращает полный текст с временны́ми метками — мы передаём его в следующий узел без очистки.
Шаг 3. Суммаризация через ИИ
Транскрипт уходит в языковую модель с системным промптом. Мы просим выдать: краткое резюме на 3–5 предложений, список из 5 ключевых тезисов, основные темы видео и эмоциональный тон (позитивный, нейтральный, критический). Для большинства каналов хватает claude-haiku или gpt-4o-mini — они быстрые и дешёвые. Результат — структурированный JSON, который дальше раскладывается по полям Airtable.
Транскрибация + суммаризация одного 15-минутного ролика занимает 40–60 секунд и стоит около 12 центов. Для мониторинга 3 каналов с 5 новыми видео в неделю — это менее 2 $ в месяц.
Шаг 4. Запись в Airtable
Airtable принимает данные через официальный REST API — в n8n есть готовый узел Airtable без написания кода. Структура базы под такой workflow: поля Video ID, Title, Channel, Published At, Views, Duration, Transcript (длинный текст), Summary, Key Points (длинный текст), Topics (мультиселект), Tone, Processed (чекбокс). Поле Processed позволяет повторно запускать workflow без дублирования записей — новый узел сначала проверяет, есть ли уже такой Video ID в базе.
Кейс: мониторинг конкурентов для маркетингового агентства
К нам обратилось маркетинговое агентство из Москвы — они вели клиента в нише онлайн-образования и хотели понимать, что делают 8 конкурентных каналов на YouTube. До автоматизации один аналитик тратил около 6 часов в неделю: смотрел ролики, делал конспекты, сводил данные в таблицу вручную.
Мы собрали workflow за 2 рабочих дня: n8n раз в сутки в 7:00 обходит все 8 каналов, обрабатывает новые видео и пишет результаты в Airtable. Аналитик открывает таблицу утром и видит всё вышедшее за прошлые сутки с готовыми резюме и тегами тем. Результат: 6 часов ручной работы в неделю → 20 минут на проверку и выводы. За первый месяц команда обнаружила, что два конкурента активно продвигают формат «мини-курс за 5 дней» — и запустили аналогичный формат для своего клиента раньше других.
Частые вопросы и подводные камни
- Длинные видео (1+ час): транскрипт большой, токены дорогие. Решение — резать на чанки по 10 минут, суммаризировать каждый, потом делать мета-резюме
- Каналы без русскоязычных субтитров: Whisper справляется сам, но точность на сильном акценте падает до ~85% — для задач мониторинга этого достаточно
- Лимиты YouTube API: при мониторинге 20+ каналов квота заканчивается. Решение — разносить проверки по времени или брать платный план
- Приватные и age-restricted видео: yt-dlp не скачает без авторизации, такие ролики пропускаем или логируем отдельно
Инструменты и стоимость
- n8n (self-hosted) — бесплатно, нужен VPS от 5 $/мес
- YouTube Data API v3 — бесплатно до 10 000 единиц/день
- yt-dlp — open source, бесплатно
- OpenAI Whisper API — ~0,006 $/мин аудио
- Claude Haiku или GPT-4o-mini для суммаризации — ~0,001–0,003 $ за ролик
- Airtable — бесплатный план до 1 000 записей, далее от 10 $/мес
Итого для мониторинга 5–10 каналов с 20–30 видео в неделю реальные затраты — 3–8 $ в месяц на API плюс стоимость VPS. Это дешевле одного часа работы аналитика. Парсинг YouTube-каналов с ИИ окупается буквально с первого запуска.
Такой workflow легко расширяется: добавьте уведомление в Telegram, когда выходит видео от ключевого конкурента, или автоматическую генерацию отчёта в Google Docs раз в неделю. Главное — база в Airtable уже есть, дальше всё строится на ней.
Хотите готовый workflow под ваши каналы?