Що таке когортний аналіз і чому він важливий
Когорта — це група користувачів, що мають спільну характеристику у визначеному часовому вікні. Найчастіше це місяць першої покупки або реєстрації. Когортний аналіз відстежує, який відсоток кожної когорти повертається у наступні місяці.
Без когортного аналізу агрегатні метрики утримання тебе обманюють. Загальний графік «щомісячних активних користувачів» може показувати зростання, навіть коли продукт погіршується — бо залучення нових користувачів маскує зростаючий відтік із ранніх когорт. Когортний аналіз розкриває правду: чи залишаються активними користувачі, що прийшли 6 місяців тому? Чи покращується утримання між когортами з часом?
💡 Якщо утримання на 1-му місяці нижче 20% для споживчого застосунку — зростання рано чи пізно зупиниться незалежно від витрат на залучення. Когортний аналіз дозволяє виявити це завчасно.
Розуміння матриці утримання
Результат когортного аналізу — матриця утримання: таблиця, де рядки — когорти (місяць залучення), стовпці — часові періоди (місяці після залучення), а кожна клітинка показує відсоток вихідної когорти, що залишається активною в цей період. Діагональ матриці відповідає одному й тому ж календарному місяцю, спостережуваному з перспективи різних когорт.
| Когорта | Розмір | Місяць 0 | Місяць 1 | Місяць 2 | Місяць 3 | Місяць 4 | Місяць 5 |
|---|---|---|---|---|---|---|---|
| Січ 2025 | 1 240 | 100% | 41% | 28% | 22% | 18% | 16% |
| Лют 2025 | 980 | 100% | 46% | 31% | 25% | 20% | — |
| Бер 2025 | 1 560 | 100% | 52% | 35% | 27% | — | — |
| Кві 2025 | 1 180 | 100% | 58% | 38% | — | — | — |
| Тра 2025 | 1 420 | 100% | 61% | — | — | — | — |
Зверни увагу, як утримання на 1-му місяці зростає між когортами (41% → 61%). Це говорить про те, що зміни в продукті або онбордингу між січнем і травнем спрацювали — більше користувачів повертається після першого місяця. Саме цей інсайт сховано в сирих агрегатних метриках.
Підготовка даних у pandas
Відправна точка — таблиця транзакцій або подій з щонайменше двома колонками: user_id та event_date. Потрібно вивести для кожного користувача: місяць когорти (місяць першої покупки) та порядковий номер місяця кожної наступної покупки.
Побудова матриці утримання крок за кроком
Візуалізація через теплову карту
Матриця утримання стає значно читабельнішою у вигляді кольорової теплової карти. Високі значення утримання відображаються темно-синім, низькі — світлим, що робить тенденції миттєво помітними для будь-якого стейкхолдера.
Розрахунок коефіцієнта відтоку
Відтік — це доповнення утримання: відсоток користувачів, що не повернулися. Щомісячний відтік когорти в період N — це просто 100 - retention_at_N. Але корисніша метрика — інкрементальний відтік: відсоток втрачених між двома послідовними періодами.
Як інтерпретувати та презентувати результати
Матриця утримання корисна лише тоді, коли ти вмієш перекласти цифри в бізнес-рішення. Ось фреймворк для інтерпретації:
| Паттерн | Що це означає | Дія |
|---|---|---|
| Утримання на 1-му місяці зростає між когортами | Онбординг або продуктові покращення спрацювали | Подвоїти зусилля в тому, що змінилося |
| 1-й місяць стабільний, але 3-й падає | Користувачі починають, але втрачають звичку | Покращити повторне залучення та петлі звички |
| Одна когорта значно гірша за сусідні | Поганий канал залучення або баг у продукті | Дослідити конкретний період |
| Утримання стабілізується після 3-го місяця (~15%+) | Є здорова база лояльних користувачів | Зосередитися на розширенні цього сегменту |
| Утримання падає майже до 0 до 2-го місяця | Проблема з product-market fit | Поговорити з тими, хто відтік, переосмислити цикл |
Презентація стейкхолдерам
Коли презентуєш когортне утримання нетехнічній аудиторії, починай з бізнес-висновку, а не з методології. Замість «Утримання на 1-му місяці зросло з 41% до 61% між когортами січня–травня» скажи: «Більше половини нових клієнтів тепер повертаються за другою покупкою протягом 30 днів — це на 20 п.п. більше, ніж на початку року. Це безпосередньо скорочує термін окупності витрат на залучення клієнтів.»
🎯 Завдання аналітика — не побудувати теплову карту, а відповісти на питання: «Чи стає наш продукт кращим або гіршим у збереженні користувачів?» Когортний аналіз — найнадійніший спосіб відповісти на нього.
