Нулевая правда: как стартап ZeroTrue бросает вызов глобальной эпохе дипфейков
Контекст и манифест
Наша мировая цифровая экосистема вошла в новую фазу. Уже сегодня генеративный ИИ (GenAI) достиг критической точки: синтетический контент по правдоподобию практически неотличим от человеческого. Мы уже видим, как «голос босса» убеждает сотрудника перевести деньги по Zoom, как «журналист» в видео продвигает сомнительные схемы, как «чиновник» рассылает сообщения с фейковых аккаунтов.
Это не будущее — это происходит уже сегодня. В Гонконге сотруднику на видеоконференции показали «начальников» и вынудили перевести около 20 млн фунтов — комбинация видео- и голосового дипфейка сработала безупречно.
Проблема нарастает быстрее, чем обновляются практики защиты. По данным Gartner, значительная часть ИТ-организаций в 2024 году всё ещё на стадии начального исследования GenAI, а интеграция в процессы лишь у меньшинства — структурный разрыв, которым пользуются злоумышленники.
«Мы уже перешли грань, когда человек мог распознать на глаз видео и изображение. Сейчас нельзя однозначно классифицировать источник происхождения информации».
Мы добавим сюда ещё один важный слой: это не только про деньги. Это про манипулирование общественным мнением, пропаганду и мимикрию под государства. И да, про сложные, целевые, многовекторные атаки, где письмо от «CFO» поддерживается звонком «CEO» и «совещанием» в видео — весь набор синтеза в одном кейсе. Попытки обмануть крупнейшие компании через голосовое клонирование уже фиксировались публично; такие истории — лишь вершина айсберга.
В гуманитарной плоскости это выглядит так: у человека отбирают право доверять своим чувствам. В общественной — это риск системной дезинформации на выборах и в медиа (вплоть до подмены нарративов). Исследовательские центры и институты фиксируют волну АИ-поддерживаемых манипуляций и спорят о масштабе, но «на земле» это уже мешает людям отличать реальность от симуляции.
Зачем мы это делаем
ZeroTrue — наш ответ на кризис доверия. Мы строим универсальный фильтр, который автоматически классифицирует синтетический контент во всех шести модальностях: аудио, музыка, видео (в проде), текст и код (β/ R&D), а также изображения (на очереди). Мы целимся не в «ещё один детектор», а в разделитель между честным и вредоносным применением ИИ.
Почему универсальность? Потому что атакующий давно мультиканален. Узкий детектор текста пропустит связку «письмо + звонок», а аудио-детектор не поймёт, что видео в кадре тоже фейк. Мы обязаны покрывать комбинации сигналов.
«На рынке почти нет сервисов, которые охватывают все модальности и ещё дают публичное социальное доказательство. Мы будем это делать — и по отдельности, и в цепочках: изображения, видео, музыка, голоса, текст и их комбинации».
Что реально происходит прямо сейчас (кейсы)
- Мульти-видео-колл с «руководством» → перевод средств (~£20M): видео- и голосовые дипфейки в одной сцене.
- Имитация топ-менеджера/публичного лица → давление на сотрудников/партнёров: сочетание аватаров, голосового синтеза, соцсетей.
- Журналистские «видео-объявления» → продвижение сомнительных продуктов: дипфейки медийных лиц.
- Вишинг/смс-кампании с ИИ-голосом → массовые фишинговые векторы, о которых предупреждает ФБР.
Финансовые потери и репутационный ущерб идут рядом. Профильные отчёты прогнозируют взрывной рост угроз в кол-центрах и реальном времени (Zoom/Teams): контакт-центры — новый фронтир.
Продукт, доказательства и дорожная карта
Что уже работает
- Аудио, музыка, видео — прод.
- Текст и код — β / R&D.
- Сложные пайплайны для многовекторных атак: видео-генератив + дипфейк-замена лица/речи; голос-синтез + текст, частично отредактированный человеком; кросс-проверки метаданных, временных и поведенческих паттернов.
- Защита от адверсариала: аугментации, насыщение датасетов примерами обходов, регулярные «теневые» тесты на свежих генераторах.
Откуда данные и как с ними аккуратно
Мы комбинируем источники: собственная генерация, внешние провайдеры, сбор публичных семплов (с соблюдением лицензий). Обнаружили защищённый авторским правом образец — исключаем. Трудные выборки собираем целенаправленно, не боимся «грязной» реальности продакшена.
Социальное доказательство и прозрачность
Мы готовим публичные репорты с метриками (AUROC/F1, FP/FN, устойчивость к сжатию/шуму/переводу), кейсы пилотов (с анонимизацией при необходимости) и расширенные отчёты с метаданными для интерпретации. Наша позиция проста: детекция вероятностна, но полезна. Мы всегда показываем уверенность и объяснение, не продаём «магическую истину».
Где ZeroTrue полезен «уже сегодня»
- E-mail / коммуникационная безопасность: анти-фишинг с голосовой валидацией входящих звонков «от руководства».
- Медиа и платформы: проверка загружаемого видео/аудио/изображений перед публикацией или маркировкой.
- Контакт-центры и финсектор: проверка «живости» и синтетичности голоса во время разговора; автотриггеры для second-factor.
Интеграции и стандарты
Мы смотрим в сторону C2PA / Content Credentials (метаданные происхождения контента), водяных знаков и дружим с инфраструктурой предприятия: SIEM/SOAR, MTA, CMS/MDM. Для верифицируемой «цепочки происхождения» это критично.
Приватность и регионы
Мы бережно относимся к данным: предлагаем пользователю указать регион и хранить данные локально в регионе, используем шифрование, срок хранения ограничен, удаление по запросу on-term. Пользователь может опт-ин на использование своих данных для улучшения моделей.
Минимальные обязательства по комплаенсу (набросок)
- Региональное хранение и обработка; шифрование «на покое» и «в транзите».
- Контроль доступа и аудит логов; изоляция сред обучения.
- Процедуры инцидент-репортинга и «human-in-the-loop» для спорных кейсов.
- Дружественная формулировка к будущим требованиям (EU AI Act-friendly wording).
Модель доступа и экономика
Freemium с еженедельным возобновлением кредитов для ранних пользователей; SDK/API для интеграций; пакетные тарифы и кредитная модель. Важен честный TCO: предиктабельные лимиты, приоритет очередей, отчётность по вызовам.
«Гонка» и наши три ключевые фичи
- Мультисигнальная корреляция
ZeroTrue не смотрит на модальность в одиночку. Мы строим граф проверки: связываем видео-кадры, аудиоспектры, речевые биометрии, текстовые паттерны, метаданные и поведенческие признаки (темп, латентные паузы, «дерево» монтажа). На выходе — комбинированная уверенность и объяснение, где «гуляет» сигнал. Это резко снижает ложные срабатывания «узких» детекторов. - Real-Time Call-Guard
Лёгкий агент для живых звонков/конференций: детект ливнесса, признаки синтетики, триггеры «доверяй-проверяй», безопасные «стоп-слова» для эскалации в ручную проверку. Сценарий: сотрудник слышит «директора» — Guard подсвечивает риск и предлагает верификацию через второй канал. Эту боль прямо сейчас подтверждают и отчёты о всплеске в кол-центрах. - Developer-SDK с inline-вердиктами
Пакеты для почтовых шлюзов, CMS, кол-центров и DevOps-практик (вплоть до Git-хуков для кода): вердикт и уверенность «в линию», без сложной интеграции. Для сложных цепочек — webhooks и события в SIEM.
Ритм обновлений
Мы работаем в цикле: сбор свежих семплов → аугментации/адверсариал → дообучение → релиз. При резких всплесках новых генераторов включаем мульти-ансамбли и «теневые» эксперименты. Публичные заметки — в блоге и соцсетях.
Честность, ограничения, ожидания
Мы говорим прямо: ни один детектор не даёт абсолютов. Мы показываем диапазоны вероятностей и обоснование. Это честный контракт с пользователем и базис доверия. ФБР и профильные организации прямо предупреждают: АИ усилил мошенничество, и задача — не «узнать всё с первого взгляда», а встроить проверку по умолчанию.
ZeroTrue — это инфраструктура в мире, где доверие стало дефицитом. Мы не обещаем чудес. Мы обещаем инструмент, который каждый день учится быстрее атакующего и делает ложь дороже. Подключайтесь к пилотам, присылайте сложные кейсы — «Нулевая правда» строится вместе с вами.
- Целевые фин-атаки (видео+голос) → уязвимость: доверие к «лицам» и «голосам» в онлайне → ZeroTrue: мультисигнальная корреляция + Call-Guard → остаточный риск снижается, требуются вторичные каналы верификации.
- Имперсонация лидеров/публичных фигур в рабочих чатах и звонках → ZeroTrue: фонотактика, спуф-индикаторы, кросс-метаданные.
- Медийная манипуляция/пропаганда → ZeroTrue: проверка источников + (в перспективе) C2PA-метки.