October 17

Нулевая правда: как стартап ZeroTrue бросает вызов глобальной эпохе дипфейков

https://app.zerotrue.app/scan/report/4f1d0224-bed1-4b92-80c1-9eddf2ce7090

Контекст и манифест

Наша мировая цифровая экосистема вошла в новую фазу. Уже сегодня генеративный ИИ (GenAI) достиг критической точки: синтетический контент по правдоподобию практически неотличим от человеческого. Мы уже видим, как «голос босса» убеждает сотрудника перевести деньги по Zoom, как «журналист» в видео продвигает сомнительные схемы, как «чиновник» рассылает сообщения с фейковых аккаунтов.

Это не будущее — это происходит уже сегодня. В Гонконге сотруднику на видеоконференции показали «начальников» и вынудили перевести около 20 млн фунтов — комбинация видео- и голосового дипфейка сработала безупречно.

Проблема нарастает быстрее, чем обновляются практики защиты. По данным Gartner, значительная часть ИТ-организаций в 2024 году всё ещё на стадии начального исследования GenAI, а интеграция в процессы лишь у меньшинства — структурный разрыв, которым пользуются злоумышленники.

«Мы уже перешли грань, когда человек мог распознать на глаз видео и изображение. Сейчас нельзя однозначно классифицировать источник происхождения информации».

Мы добавим сюда ещё один важный слой: это не только про деньги. Это про манипулирование общественным мнением, пропаганду и мимикрию под государства. И да, про сложные, целевые, многовекторные атаки, где письмо от «CFO» поддерживается звонком «CEO» и «совещанием» в видео — весь набор синтеза в одном кейсе. Попытки обмануть крупнейшие компании через голосовое клонирование уже фиксировались публично; такие истории — лишь вершина айсберга.

В гуманитарной плоскости это выглядит так: у человека отбирают право доверять своим чувствам. В общественной — это риск системной дезинформации на выборах и в медиа (вплоть до подмены нарративов). Исследовательские центры и институты фиксируют волну АИ-поддерживаемых манипуляций и спорят о масштабе, но «на земле» это уже мешает людям отличать реальность от симуляции.

Зачем мы это делаем

ZeroTrue — наш ответ на кризис доверия. Мы строим универсальный фильтр, который автоматически классифицирует синтетический контент во всех шести модальностях: аудио, музыка, видео (в проде), текст и код (β/ R&D), а также изображения (на очереди). Мы целимся не в «ещё один детектор», а в разделитель между честным и вредоносным применением ИИ.

Почему универсальность? Потому что атакующий давно мультиканален. Узкий детектор текста пропустит связку «письмо + звонок», а аудио-детектор не поймёт, что видео в кадре тоже фейк. Мы обязаны покрывать комбинации сигналов.

«На рынке почти нет сервисов, которые охватывают все модальности и ещё дают публичное социальное доказательство. Мы будем это делать — и по отдельности, и в цепочках: изображения, видео, музыка, голоса, текст и их комбинации».

Что реально происходит прямо сейчас (кейсы)

  • Мульти-видео-колл с «руководством» → перевод средств (~£20M): видео- и голосовые дипфейки в одной сцене.
  • Имитация топ-менеджера/публичного лица → давление на сотрудников/партнёров: сочетание аватаров, голосового синтеза, соцсетей.
  • Журналистские «видео-объявления» → продвижение сомнительных продуктов: дипфейки медийных лиц.
  • Вишинг/смс-кампании с ИИ-голосом → массовые фишинговые векторы, о которых предупреждает ФБР.

Финансовые потери и репутационный ущерб идут рядом. Профильные отчёты прогнозируют взрывной рост угроз в кол-центрах и реальном времени (Zoom/Teams): контакт-центры — новый фронтир.

Продукт, доказательства и дорожная карта

Что уже работает

  • Аудио, музыка, видео — прод.
  • Текст и код — β / R&D.
  • Сложные пайплайны для многовекторных атак: видео-генератив + дипфейк-замена лица/речи; голос-синтез + текст, частично отредактированный человеком; кросс-проверки метаданных, временных и поведенческих паттернов.
  • Защита от адверсариала: аугментации, насыщение датасетов примерами обходов, регулярные «теневые» тесты на свежих генераторах.

Откуда данные и как с ними аккуратно

Мы комбинируем источники: собственная генерация, внешние провайдеры, сбор публичных семплов (с соблюдением лицензий). Обнаружили защищённый авторским правом образец — исключаем. Трудные выборки собираем целенаправленно, не боимся «грязной» реальности продакшена.

Социальное доказательство и прозрачность

Мы готовим публичные репорты с метриками (AUROC/F1, FP/FN, устойчивость к сжатию/шуму/переводу), кейсы пилотов (с анонимизацией при необходимости) и расширенные отчёты с метаданными для интерпретации. Наша позиция проста: детекция вероятностна, но полезна. Мы всегда показываем уверенность и объяснение, не продаём «магическую истину».

Где ZeroTrue полезен «уже сегодня»

  1. E-mail / коммуникационная безопасность: анти-фишинг с голосовой валидацией входящих звонков «от руководства».
  2. Медиа и платформы: проверка загружаемого видео/аудио/изображений перед публикацией или маркировкой.
  3. Контакт-центры и финсектор: проверка «живости» и синтетичности голоса во время разговора; автотриггеры для second-factor.

Интеграции и стандарты

Мы смотрим в сторону C2PA / Content Credentials (метаданные происхождения контента), водяных знаков и дружим с инфраструктурой предприятия: SIEM/SOAR, MTA, CMS/MDM. Для верифицируемой «цепочки происхождения» это критично.

Приватность и регионы

Мы бережно относимся к данным: предлагаем пользователю указать регион и хранить данные локально в регионе, используем шифрование, срок хранения ограничен, удаление по запросу on-term. Пользователь может опт-ин на использование своих данных для улучшения моделей.

Минимальные обязательства по комплаенсу (набросок)

  • Региональное хранение и обработка; шифрование «на покое» и «в транзите».
  • Контроль доступа и аудит логов; изоляция сред обучения.
  • Процедуры инцидент-репортинга и «human-in-the-loop» для спорных кейсов.
  • Дружественная формулировка к будущим требованиям (EU AI Act-friendly wording).

Модель доступа и экономика

Freemium с еженедельным возобновлением кредитов для ранних пользователей; SDK/API для интеграций; пакетные тарифы и кредитная модель. Важен честный TCO: предиктабельные лимиты, приоритет очередей, отчётность по вызовам.

«Гонка» и наши три ключевые фичи

  1. Мультисигнальная корреляция
    ZeroTrue не смотрит на модальность в одиночку. Мы строим граф проверки: связываем видео-кадры, аудиоспектры, речевые биометрии, текстовые паттерны, метаданные и поведенческие признаки (темп, латентные паузы, «дерево» монтажа). На выходе — комбинированная уверенность и объяснение, где «гуляет» сигнал. Это резко снижает ложные срабатывания «узких» детекторов.
  2. Real-Time Call-Guard
    Лёгкий агент для живых звонков/конференций: детект ливнесса, признаки синтетики, триггеры «доверяй-проверяй», безопасные «стоп-слова» для эскалации в ручную проверку. Сценарий: сотрудник слышит «директора» — Guard подсвечивает риск и предлагает верификацию через второй канал. Эту боль прямо сейчас подтверждают и отчёты о всплеске в кол-центрах.
  3. Developer-SDK с inline-вердиктами
    Пакеты для почтовых шлюзов, CMS, кол-центров и DevOps-практик (вплоть до Git-хуков для кода): вердикт и уверенность «в линию», без сложной интеграции. Для сложных цепочек — webhooks и события в SIEM.

Ритм обновлений

Мы работаем в цикле: сбор свежих семплов → аугментации/адверсариал → дообучение → релиз. При резких всплесках новых генераторов включаем мульти-ансамбли и «теневые» эксперименты. Публичные заметки — в блоге и соцсетях.

Честность, ограничения, ожидания

Мы говорим прямо: ни один детектор не даёт абсолютов. Мы показываем диапазоны вероятностей и обоснование. Это честный контракт с пользователем и базис доверия. ФБР и профильные организации прямо предупреждают: АИ усилил мошенничество, и задача — не «узнать всё с первого взгляда», а встроить проверку по умолчанию.

ZeroTrue — это инфраструктура в мире, где доверие стало дефицитом. Мы не обещаем чудес. Мы обещаем инструмент, который каждый день учится быстрее атакующего и делает ложь дороже. Подключайтесь к пилотам, присылайте сложные кейсы — «Нулевая правда» строится вместе с вами.

  • Целевые фин-атаки (видео+голос) → уязвимость: доверие к «лицам» и «голосам» в онлайне → ZeroTrue: мультисигнальная корреляция + Call-Guard → остаточный риск снижается, требуются вторичные каналы верификации.
  • Имперсонация лидеров/публичных фигур в рабочих чатах и звонках → ZeroTrue: фонотактика, спуф-индикаторы, кросс-метаданные.
  • Медийная манипуляция/пропагандаZeroTrue: проверка источников + (в перспективе) C2PA-метки.

https://zerotrue.app/