Tracker.ru На главную

Что такое uptime и observability — простыми словами

Uptime отвечает на вопрос «сайт работает?». Observability — на «почему сайт ведёт себя именно так?». Первое нужно всем, второе — крупным распределённым системам. Разбираем разницу и помогаем выбрать.

Что такое uptime и observability — простыми словами

Uptime-мониторинг отвечает на вопрос «сайт работает?». Observability — на «почему сайт ведёт себя именно так?». Первое нужно всем, у кого есть сайт. Второе — командам с десятками сервисов и отдельным инженером по надёжности. Разбираем разницу простыми словами.

Что такое uptime?

Uptime — это процент времени, в течение которого сайт доступен пользователям. Если сайт работал 30 дней подряд без единого сбоя, его uptime за этот период — 100%. Если за месяц был час недоступности, uptime получается примерно 99,86%. Метрика бинарная: в каждый конкретный момент сайт либо отвечает корректно, либо не отвечает.

Uptime-мониторинг устроен снаружи. Специальный сервис каждые 30 секунд или каждую минуту открывает ваш адрес и проверяет результат:

  • HTTP-код ответа: 200 — хорошо, 500 или 502 — плохо.
  • Время отклика: миллисекунды до первого байта.
  • Содержимое: соответствует ли ожидаемому (например, на странице есть слово «Главная»).
  • SSL-сертификат: действителен ли, до какого числа.
  • Доступность из разных географических точек.

На основе этих данных сервис считает процент uptime, рисует график доступности и при сбое присылает алерт — в Telegram, на email, через webhook в ваш Slack. Это короткий и понятный ответ на главный вопрос владельца сайта: «всё ли в порядке прямо сейчас?».

Типичный пример: интернет-магазин подключает облачный мониторинг Tracker.ru, настраивает проверки из нескольких регионов — Москва, Франкфурт, Алматы — и получает алерт в Telegram через 30 секунд после того, как сайт перестанет отвечать. Дальше владелец открывает уведомление, видит, в каком регионе проблема, и идёт разбираться.

Что такое observability?

Observability (буквально — «наблюдаемость») — это способность понять, что и почему происходит внутри системы, по её внешнему поведению. Термин пришёл из теории управления: можно ли по выходным сигналам объекта восстановить его внутреннее состояние? В IT слово прижилось примерно с 2018 года и описывает класс инструментов, которые собирают данные изнутри приложения и помогают разобраться в причинах его поведения.

В observability принято выделять три источника данных — их называют «тремя столпами» или three pillars:

  • Логи (logs) — текстовые записи о том, что произошло. «Пользователь 42 нажал кнопку «Купить», получил ошибку платежа от Stripe».
  • Метрики (metrics) — числовые показатели во времени. «Запросов в секунду на /checkout: 120 → 80 → 30 за последние 5 минут».
  • Трейсы (traces) — путь одного запроса через все сервисы. «Запрос /checkout зашёл в API gateway, оттуда в auth-service за 12 мс, дальше в order-service за 340 мс, оттуда в платёжный шлюз — и завис на 8 секунд, пока не отвалился по таймауту».

В отличие от uptime-мониторинга, observability ставится изнутри приложения. В код добавляется инструментирование: библиотеки логирования, замеры метрик через Prometheus или OpenTelemetry, передача trace-id через все сервисы. Эти данные собираются в центральное хранилище — Datadog, New Relic, Grafana Cloud, Better Stack, Honeycomb, Loki — и там же ищутся, фильтруются и строятся дашборды.

Observability отвечает не на вопрос «работает ли», а на вопрос «почему именно так работает». Например: «оплата проходит у 99,2% пользователей, но в Казахстане — у 84%, причём только при оплате картами одного конкретного банка через одного конкретного провайдера, и только в часы пик». Такой ответ невозможно получить uptime-мониторингом — в нём нет инструментов для подобного среза.

Чем отличаются uptime-мониторинг и observability?

Если объяснять одной фразой: uptime-мониторинг отвечает «работает или не работает», observability — «почему ведёт себя именно так».

Если разложить по практическим различиям, получится примерно такая таблица.

Характеристика Uptime-мониторинг Observability
Вопрос, на который отвечает Сайт работает? Почему сайт ведёт себя именно так?
Где собираются данные Снаружи (агент опрашивает сайт) Изнутри (приложение само сообщает о себе)
Что отслеживается Доступность, скорость, SSL, контент Логи, метрики, трейсы запросов
Тип результата Бинарный (работает / не работает) + код ответа + время Подробная картина внутреннего состояния
Кому полезно Владельцу сайта, маркетологу, админу Разработчику, SRE, DevOps
Сколько стоит Десятки и сотни рублей в месяц От тысяч рублей до десятков тысяч и выше
Сколько настраивать 5 минут От нескольких дней до недель
Когда нужно Сразу, как только появился сайт Когда есть распределённая система и команда

Это не «один лучше другого» — это разные инструменты для разных задач. Uptime-мониторинг хорошо отвечает на свой вопрос, observability — на свой. Большинству сайтов нужно только первое. Распределённым системам с десятками микросервисов нужно и то, и другое: uptime-мониторинг для внешнего контроля доступности и observability для внутренней диагностики.

Что выбрать для small business?

Для малого и среднего бизнеса в подавляющем большинстве случаев достаточно uptime-мониторинга. Это касается сайтов-визиток, лендингов, корпоративных порталов, блогов, интернет-магазинов средней руки и небольших SaaS.

Признаки, что вам хватит uptime-мониторинга:

  • Один сайт или несколько сайтов на привычном стеке (PHP, Python, Node.js — без микросервисов).
  • Команды разработки нет или она маленькая (1–5 человек).
  • Бюджет на мониторинг — сотни рублей в месяц, не десятки тысяч.
  • Главные вопросы: «не упал ли сайт?», «не истекает ли SSL?», «не стал ли сайт грузиться медленнее?».
  • Уведомления нужно получать в Telegram, на email, в свой чат.

Признаки, что вам действительно нужна полноценная observability:

  • Распределённая система из десятков сервисов.
  • В команде есть SRE или DevOps-инженер с отдельной зоной ответственности за надёжность.
  • Бизнес-логика проходит через несколько внутренних API, очередей сообщений, баз данных.
  • Регулярные инциденты вида «оплата у 0,1% пользователей не проходит, но мы не понимаем, почему».
  • Бюджет на наблюдаемость — от тысяч рублей в месяц до десятков и сотен тысяч.

Между этими полюсами есть промежуточная категория — стартапы и SaaS среднего размера. Им часто полезен uptime-мониторинг плюс пара точечных наблюдательных инструментов: например, отдельный сервис ошибок (Sentry), отдельная агрегация логов и uptime отдельно. Полностью платить за единый observability-стек уровня Datadog или observability-стек BetterStack для такой команды обычно дорого и избыточно.

Краткое практическое правило: пока вы можете в голове представить устройство своего проекта целиком, вам хватит uptime-мониторинга. Как только вы перестали умещать схему сервисов в голове и без логов уже не понимаете, что произошло — пора смотреть в сторону observability.

Использует ли Tracker.ru observability?

Tracker.ru — это сервис uptime-мониторинга, и это его главный фокус. При этом у него есть несколько возможностей, которые выходят за рамки чистого «работает / не работает» и приближают его к лёгкой форме наблюдательности — пользователь видит больше, чем просто бинарный статус.

Что Tracker.ru умеет сверх классического uptime:

  • Проверки из нескольких регионов. Сайт опрашивается одновременно из Москвы, Франкфурта и Алматы. Если упал только один регион — это, скорее всего, локальная сетевая проблема, а не падение сайта. Подробнее о мульти-региональных проверках.
  • Скриншоты сайта после восстановления. Когда сайт возвращается онлайн после инцидента, Tracker.ru делает серию скриншотов — через 1, 6, 12 и 24 часа — и складывает их в историю. Это помогает поймать визуальные регрессии: вместо нормальной страницы стала отдаваться заглушка от хостера или белый экран от ошибки в JavaScript.
  • Apdex и время отклика. Кроме факта доступности, сервис считает Apdex — числовую оценку, насколько комфортно пользователю работать с сайтом по скорости отклика.
  • Мониторинг SSL-сертификатов. Алерт за 30, 14 и 7 дней до истечения сертификата — отдельная задача, которую часто забывают, пока сайт не сломается с ошибкой «небезопасное соединение».
  • Heartbeat-мониторинг для cron-задач. Скрипт или планировщик пингует Tracker.ru, и если пинг не пришёл вовремя — приходит алерт. Это уже про внутренние процессы, а не про публичный URL.
  • История проверок и инцидентов. Можно посмотреть, как менялась доступность за месяц или год, какие были инциденты, сколько они длились.

Это ощутимо больше, чем «дашборд с зелёной точкой», но всё ещё не полноценный observability-стек уровня Datadog или Grafana Cloud. У Tracker.ru нет приёма логов из вашего приложения, нет распределённого трейсинга запросов через микросервисы, нет агента, который ставится на сервер и снимает метрики ОС. Это сознательное решение: для большинства сайтов это и не нужно, а кому нужно — у тех есть свой выбор инструментов.

Если вкратце: Tracker.ru — это «расширенный uptime», достаточный для лендингов, корпоративных сайтов, интернет-магазинов и небольших SaaS. Если у вас инфраструктура уровня сотен микросервисов и есть команда SRE — для диагностики вам понадобится отдельный observability-стек. А Tracker.ru при этом всё равно может стоять рядом и отвечать на свой простой вопрос: доступен ли наш публичный сайт прямо сейчас и из всех ли стран, где живут пользователи.

Если хочется попробовать на своих сайтах — заведите бесплатный аккаунт, добавьте URL и подключите Telegram-уведомления. Тарифы и лимиты — на странице тарифы Tracker.ru.

См. также