about me
December 29, 2021

Резюме \\ Обо мне

English version: https://teletype.in/@uberwow/english

Я Станислав (@uberwow), разработчик, специалист по машинному обучению и обработке данных. Генератор идей и креатива :)

Мои компетенции:

  • Менеджмент проектов, организация работы команд; (YouTrack)
  • Создание архитектуры продуктов и MVP;
  • Создание UI\UX концепта продукта; (Figma, Balsamiq Mocup)
  • Разработка: Python, C\C++, Pascal, ASMx86;
  • Анализ и реверс инжиниринг бинарных файлов; (IDA, x64dbg)
  • Исследование уязвимостей, фаззинг, дебаггинг приложений; (WinAFL, BinDiff, DynamoRIO, PinTools)
  • Разработка компиляторов, обфускация кода, построение и парсинг AST;
  • Text mining, NLP: Кластеризация, классификация, структурирование, саммаризация, извлечение сущностей;
  • Data mining: предобработка, создание датасетов, очистка;
  • ML\DL;
  • Парсинг, сбор данных с открытых источников;
  • Создание ботов для Telegram, веб кравлеров;
  • ASR, STT, TTS: Распознавание и синтез речи;

Мои интересы:

  • Создание и разработка проектов для стартапов;
  • NLP: классификация, анализ и обработка текста, языковые модели, трансформеры;
  • Кравлинг, скрапинг, парсинг, сбор данных;
  • Графы знаний, графовые базы данных, экспертные и рекомендательные системы;
  • Умные чатботы, разговорный ИИ;
  • text2image модели;
  • STT, TTS, ASR, VAD;
  • Киберсек, анализ вредоносного кода, анализ поведения;
  • Hardware, роботизированная техника, дроны, DIY;
  • CV: OpenCV, dlib, Object recognition, Object tracking, DeepFace;
  • Компиляторы: AST, разбор синтаксиса, генерация кода;
  • Age hacking: Продление жизни \ замедление старения, ЗОЖ, ПП;
  • Анализ корелляций и зависимостей с датчиков (Apple Watch, Oura Ring, умные весы, анализ рациона питания) для анализа состояния здоровья;
  • Саморазвитие, духовный рост, осознанные практики;

Мои проекты:

(2016) Anykey.repair - SaaS сервис для оказания дистанционной помощи при возникновении проблем с системой и программным обеспечением.

(2017) RestTime - Приложение с элементами AI для анализа показателей здоровья через поведение пользователя по веб-камере, с целью предотвращения болезней позвоночника, мочеполовой системы и проблем со зрением.

(2019) RssCloud - Мобильное приложение и веб сервис для сбора, обработки и фильтрации информации по заданным источникам с элементами AI. https://teletype.in/@uberwow/RssCloud

(2020) iProt - сервис защиты цифровых книг от незаконного тиражирования. Презентация: https://cloud.mail.ru/public/FTt9/gBkJ9PpVL

(2020) ReStartup - Веб приложение для связи стартаперов, разработчиков и инвесторов с целью объединения ресурсов и запуска совместных проектов. https://titanida.com/restartup_ru

(2021) Мои Документы - мобильное приложение для удобного хранения и быстрого доступа ко всем сохранённым документам. https://titanida.com/mydocsapp_ru

(2021) Textgen.ai - SaaS сервис для генерации уникального контента с элементами AI на основе введённого материала и выбранных источников.

(2021) @bookscrawler_bot - Бот, как инструмент анализа распространения цифрового контента в Telegram для поиска книг с индексацией по открытым каналам. Поддерживается поиск по нечёткому названию.

(2022) ELSE - SaaS сервис с элементами AI для распознавания, транскрибирования и авто-протоколирования речи для онлайн совещаний и конференций. https://teletype.in/@uberwow/ELSE

(2022-в процессе) Voicecover - сервис для закадрового перевода видео роликов в двух направлениях: с русского на английский и с английского на русский. https://vc.ru/tribuna/356914-my-sdelali-zakadrovyy-perevod-na-angliyskiy-russkoyazychnyh-video?comments

(2023-в процессе) CheckGPT - Нейросеть для определения контента, сгенерированного большими языковыми моделями (ChatGPT, GPT3). Telegram бот. Сайт: https://checkgpt.app. Читать статью о CheckGPT.

(2023-в процессе) ruChatGPT - Телеграм бот @ruChatGPT, позволяющий использовать всю мощь англоязычного ChatGPT на русском языке за счёт векторизации запросов и ответов.

(2023-в процессе) HideGPT.app - Сервис и телеграм бот для обхода обнаружения текстов, написанных большими языковыми моделями сервисами для проверки на предмет написания AI.

Мой опыт:

  • Опыт в IT более 15 лет.
  • Python 5+ лет.
  • C\C++ 5+ лет, в том числе низкоуровневая разработка под Windows.
  • Разработка проектов для стартапов 4+ года.
  • Сбор и обработка данных 2+ года (Selenium, Requests, BeautifulSoup4, pyscrapy).
  • ML 3+ года (PyTorch, Scikit-Learn, Catboost, XGBoost, Classification & Clusterization Algorithms, SVM, Decision Trees, Feature Extraction, Feature engineering, Pandas, numpy, Matplotlib).
  • NLP 2 года (языковые модели, text-to-code, кластеризация и классификация, машинный перевод, саммаризация и NLU)

Последние достижения:

  1. (2019) Первое место на хакатоне Цифровой Прорыв в Самаре.
  2. (2021) Первое место на хакатоне TenderHack Самара 2021 кейс Распознавание неименованных сущностей.
  3. (2021) Первое место на хакатоне Лидеры Цифровой Трансформации в Москве 2021г - проект транскрибации и саммаризации встреч.
  4. (2021) Второе место на хакатоне StartupHack 12||21 онлайн кейс GroupIB.
  5. (2021) Четвёртое место VTB API Hackathon онлайн 2021 г - кейс анализ вредоносных вложений - движок анализатора XML.
  6. (2021) Участие в хакатоне hacks-ai \ Samara \ 2021, кейс Спасение жизней с помощью ИИ.
  7. (2022) Участие в хакатоне hacks-ai \ Ярославль \ 2022, кейс Прогнозирование риска развития сердечно-сосудистого заболевания пациента.
  8. (2022) Третье место на хакатоне Moscow City Hack 2022 кейс UralSib банка аналитический маркетинговый дэшборд для СММ отдела.
  9. (2022) Первое место на хакатоне Лидеры Цифровой Трансформации в Москве в 2022г - Сервис формирования задач для москвичей по контролю работ подрядчиков в сфере городского благоустройства. Описание: titanida_com/lct2022case8.
  10. (2022) Второе место на хакатоне TenderHack Москва 2022 кейс Разработка предиктивной системы для анализа ключевых метрик котировочных сессий на портале поставщиков.
  11. (2022) Первое место на хакатоне Лидеры Цифровой Трансформации 2022 в Москве. Кейс - Задача №8: Сервис формирования задач для москвичей по контролю работ подрядчиков в сфере городского благоустройства.
  12. (2023) Участие на хакатоне EVRAZ Hackathon 2023 кейс Цифровой двойник эксгаустеров агломашины и раннее предсказание его поломки.
  13. (2023) Участие в хакатоне Лидеры Цифровой Трансформации 2023 в Москве. Кейс - Задача №10: Сервис прогнозирования работ по содержанию и ремонту объектов городского хозяйства

Чем могу быть полезен:

В первую очередь меня интересуют DeepTech (высокотехнологичные стартапы в области AI: медицины, NLP, роботизации, чатботов, обработки информации, fintech) со сформированной идеей, MVP, проведенным custdev и проверенной, рабочей гипотезой - при совпадении каких-то из этих критериев мы найдем синергию.
  1. Могу помочь с оцифровкой вашей идеи в осмысленное техническое задание;
  2. Могу помочь с планированием архитектуры проекта, подготовкой MVP;
  3. Могу помочь с созданием визуальной части прототипа, UX (с точки зрения экспиренса пользователя — за дизайном - к дизайнеру :));
  4. Могу помочь с организацией процесса поиска и подбора команды;
Если вы ментор или ищете ментора, буду рад пообщаться.
Если вы разработчик, продакт или инвестор, дайте знать — набираю команду, контакты ниже.

Обучение:

  • Московский инновационный кластер - Академия инноваторов;
  • Образовательная платформа Маргулана Сейсембаева - Кайдзен планирование 2.0 + Power management;
  • Маргулан Сейсембаев - Построение эффективной команды;
  • Маргулан Сейсембаев - Целеполагание;
  • Маргулан Сейсембаев - Эффективность;

Сообщества:

  • Security-Band (https://security-band.com/)
  • FutureAGI Syndicate
  • Titanida Group (https://titanida.com)
  • k0b1x team
  • Good Genius team
  • Интеллект Групп (https://intellectg.ru)

Мои open-source проекты:

(2017) StringHeur - Компонент (часть) эвристического движка для определения потенциально-вредоносных текстовых строк в (бинарных) файлах.

(2017) SkyChain - p2p децентрализованный e2e мессенжер с дизайном и боатми, как у Telegram. Читать подробнее с картинками.

(2018) Progress Antivirus - Десктопное приложение в виде GUI под Windows, часть антивирусной системы для обнаружения вредоносных объектов на основании эвристики, машинного обучения и системы белых и черных списков.

(2018) Progress Backer's Invest Panel - Frontend панель инвестора ICO\IDO\Token sale проекта Progress для реализации PRU токенов. / https://titanida.com/progresstokensale

(2018) IcoPixels.io - Проект попиксельной рекламы (современная версия легендарного сайта milliondollarhomepage.com) для проекта близких к blockchain, crypto-currency, ICO (TGE, Token Sale) и криптобиржам. / https://titanida.com/icopixels_io_en

(2019) HeartDesiseDetect, JustDoctor - наработки двух проектов по предсказанию сердечнососудистых и других заболеваний в рамках хакатонов hacks-ai.

(2020) JustDoctor - Веб сервис с элементами ИИ и NLP для определения вероятности летального исхода пациента в стационаре на основании его истории болезни. / https://titanida.com/justdoctor

(2020) BEC Email Analyser - Браузерное расширение для анализа и обнаружения входящей email корреспонденции на предмет спама, вредоносных вложений и подложных писем с элементами СИ на основе ИИ. / https://titanida.com/bec_email_analyzer

(2021) NFT Scanner - SaaS B2C\B2B сервис анализа NFT работ на предмет уникальности, степени похожести на чужие работы, проиндексированные в базе данных, анализ на плагиат и выдачу чужих работ за свои. (MVP проекта сделан в рамках хакатона Definition Насkathon в треке Rarible в команде SecurityBand). В проекте использовались алгоритмы кластеризации, нечетких хэшей (ssdeep), perceptual hash, avarage hash (MeanHash). Презентация проекта: https://cloud.mail.ru/public/qsDm/wm1BYYWdu. Демо проекта: https://youtu.be/EnmbVleOJwQ

(2021) XML Deep Analyser - Веб сервис \ беклогика для анализа входящих и исходящих сообщений содержащих XML файл на предмет вредоносных вложений. / https://titanida.com/xml_deep_analyser

(2022) BIQubic Marketing Dashboard - проект, объединяющий в себе информацию из социальных сетей компании и других источников. Обрабатываются посты, лайки, комментарии, реакции, репосты и видео. Извлечение идет из Youtube и Telegram каналов, VK, OK.ru, **gram, Яндекс и Google аналитики и объединяются с инструментами бизнес аналитики компании (PowebBI). Обрабатываемая в реальном времени информация позволяет управлять репутацией компании, анализировать вирусные посты и комментарии, анализирует эффективность работы маркетингового отдела в целом.

(2022) Платформа "Живой город" - позволяет оптимизировать работы со сметами по благоустройству, а также в короткие сроки подготовить данные для взаимодействия с ЕАИСТ. При работе со сметами используется информация из дополнительных классификаторов и справочников (ФИАС, ОКЕИ и т. д.).

(2023) RusTextMorpher v1.2 - Скрипт для офбускации и деперсонализации пользовательского текста. Позволяет гибко настраивать методы обфускации и возвращает результат в виде процента похожести оригинального и обфусцированного текста.

(2023) Цифровой двойник эксгаустеров - Как мы создавали цифровой двойник для агломерационной машина и делали предсказание неисправности, предназначенной для окускования железных руд и концентратов для доменной плавки путем их спекания на аглоленте под разрежением создаваемым эксгаустерами. Хакатон ЕВРАЗ 2023.

(2023) Платформа "Коммунальный Эксперт" - Эффективная прогностическая система управления жилищно-коммунальным хозяйством в масштабах города. Платформа «Коммунальный Экспер» агрегирует данные об объектах, инцидентах и ремонтных работах из различных источников, связывает их и обрабатвыает с целью рекомендаций по будущим работам для предотвращения или более быстрого реагирования на инциденты. Хакатон ЛЦТ 2023.

Контакты:

Email: progression.official🌍gmail.com

Telegram:

Github:

Github ссылка: https://bit.ly/3FSnvDS

Заметки в блоге:

https://titanida.com/OpenAI_plugins_LLaMA_plugins - Искусственный интеллект знакомят с реальным миром через плагины. Разбираемся с ChatGPT plugins - представьте себе мост, по которому любую нужную нейросети информацию, для более комплексного и точного ответа, подвозят и сгружают прямо в "мозг".

https://titanida.com/OpenAI_plugins_details - OpenAI ChatGPT Plugins - подробности и техническая инофрмация. В этой статье поделюсь конкретикой по основным плагинам, как они функционируют и что удалось узнать на текущий момент.

https://titanida.com/Signs_of_the_year - Мои итоги года в цифрах :: My signs of the year. Традиционно принято подводить итоги года. Я, как человек с техническим складом ума, просто обожаю всё оцифровывать и вести статистику.

https://titanida.com/CheckGPT_to_detect_ChatGPT - CheckGPT.app - Нейросеть для определения текста, сгенерированного большими языковыми моделями (ChatGPT, GPT3, BLOOM, you.com AI). Вводная часть, мотивация, риски, идея и реализация, возможности.

https://titanida.com/chatgpt_change_the_way_we_thinking - ChatGPT заставит нас многое переосмыслить, то как мы думаем, учимся, работаем и общаемся.

https://titanida.com/is_LaMDA_killer_of_ChatGPT - Google запускают LaMDA - убийцу ChatGPT.

https://titanida.com/ChatGPT_with_russian_tokenization_ruChatGPT - Мы выработали подход, при котором происходит процесс кодирования запроса в ChatGPT на русском в вектора на английском, и преобразовании векторов на английском в ответе от модели, обратно на русский язык, мы добились прямого общения с моделью без ограничения по входящей и исходящей длине векторов по всей базе знаний модели из датасета на английском языке.

https://titanida.com/HideGPTapp_to_mask_AI_generated_text - Что, если перед нами стоит противоположная задача: скрыть факт написания ChatGPT от сервисов проверки? Мы разобрались в этом вопросе и придумали алгоритм для сокрытия (маскировки) текста, написанного ИИ от всех существующих решений по обнаружению текстового ИИ контента! https://hidegpt.app/

https://titanida.com/AI_chatbots_become_alive_AGI - В больших языковых моделях начинает "проявляться" сознание? Как проявляется факт самосознания и самовосприятия у чатботов с искуственным интеллектом?