Резюме \\ Обо мне
English version: https://teletype.in/@uberwow/english
Я Станислав (@uberwow), разработчик, специалист по машинному обучению и обработке данных. Генератор идей и креатива :)
Мои компетенции:
- Менеджмент проектов, организация работы команд; (YouTrack)
- Создание архитектуры продуктов и MVP;
- Создание UI\UX концепта продукта; (Figma, Balsamiq Mocup)
- Разработка: Python, C\C++, Pascal, ASMx86;
- Анализ и реверс инжиниринг бинарных файлов; (IDA, x64dbg)
- Исследование уязвимостей, фаззинг, дебаггинг приложений; (WinAFL, BinDiff, DynamoRIO, PinTools)
- Разработка компиляторов, обфускация кода, построение и парсинг AST;
- Text mining, NLP: Кластеризация, классификация, структурирование, саммаризация, извлечение сущностей;
- Data mining: предобработка, создание датасетов, очистка;
- ML\DL;
- Парсинг, сбор данных с открытых источников;
- Создание ботов для Telegram, веб кравлеров;
- ASR, STT, TTS: Распознавание и синтез речи;
Мои интересы:
- NLP: классификация, анализ и обработка текста, языковые модели, трансформеры;
- Кравлинг, скрапинг, парсинг, сбор данных;
- Графы знаний, графовые базы данных, экспертные и рекомендательные системы;
- Умные чатботы, разговорный ИИ;
- text2image модели;
- STT, TTS, ASR, VAD;
- Киберсек, анализ вредоносного кода, анализ поведения;
- Hardware, роботизированная техника, дроны, DIY;
- CV: OpenCV, dlib, Object recognition, Object tracking, DeepFace;
- Компиляторы: AST, разбор синтаксиса, генерация кода;
- Age hacking: Продление жизни \ замедление старения, ЗОЖ, ПП;
- Анализ корелляций и зависимостей с датчиков (Apple Watch, Oura Ring, умные весы, анализ рациона питания) для анализа состояния здоровья;
- Саморазвитие, духовный рост, осознанные практики;
Мои проекты:
(2016) Anykey.repair - SaaS сервис для оказания дистанционной помощи при возникновении проблем с системой и программным обеспечением.
(2017) RestTime - Приложение с элементами AI для анализа показателей здоровья через поведение пользователя по веб-камере, с целью предотвращения болезней позвоночника, мочеполовой системы и проблем со зрением.
(2019) RssCloud - Мобильное приложение и веб сервис для сбора, обработки и фильтрации информации по заданным источникам с элементами AI. https://teletype.in/@uberwow/RssCloud
(2020) iProt - сервис защиты цифровых книг от незаконного тиражирования. Презентация: https://cloud.mail.ru/public/FTt9/gBkJ9PpVL
(2020) ReStartup - Веб приложение для связи стартаперов, разработчиков и инвесторов с целью объединения ресурсов и запуска совместных проектов. https://titanida.com/restartup_ru
(2021) Мои Документы - мобильное приложение для удобного хранения и быстрого доступа ко всем сохранённым документам. https://titanida.com/mydocsapp_ru
(2021) Textgen.ai - SaaS сервис для генерации уникального контента с элементами AI на основе введённого материала и выбранных источников.
(2021) @bookscrawler_bot - Бот, как инструмент анализа распространения цифрового контента в Telegram для поиска книг с индексацией по открытым каналам. Поддерживается поиск по нечёткому названию.
(2022) ELSE - SaaS сервис с элементами AI для распознавания, транскрибирования и авто-протоколирования речи для онлайн совещаний и конференций. https://teletype.in/@uberwow/ELSE
(2022-в процессе) Voicecover - сервис для закадрового перевода видео роликов в двух направлениях: с русского на английский и с английского на русский. https://vc.ru/tribuna/356914-my-sdelali-zakadrovyy-perevod-na-angliyskiy-russkoyazychnyh-video?comments
(2023-в процессе) CheckGPT - Нейросеть для определения контента, сгенерированного большими языковыми моделями (ChatGPT, GPT3). Telegram бот. Сайт: https://checkgpt.app. Читать статью о CheckGPT.
(2023-в процессе) ruChatGPT - Телеграм бот @ruChatGPT, позволяющий использовать всю мощь англоязычного ChatGPT на русском языке за счёт векторизации запросов и ответов.
(2023-в процессе) HideGPT.app - Сервис и телеграм бот для обхода обнаружения текстов, написанных большими языковыми моделями сервисами для проверки на предмет написания AI.
Мой опыт:
- Опыт в IT более 15 лет.
- Python 5+ лет.
- C\C++ 5+ лет, в том числе низкоуровневая разработка под Windows.
- Разработка проектов для стартапов 4+ года.
- Сбор и обработка данных 2+ года (Selenium, Requests, BeautifulSoup4, pyscrapy).
- ML 3+ года (PyTorch, Scikit-Learn, Catboost, XGBoost, Classification & Clusterization Algorithms, SVM, Decision Trees, Feature Extraction, Feature engineering, Pandas, numpy, Matplotlib).
- NLP 2 года (языковые модели, text-to-code, кластеризация и классификация, машинный перевод, саммаризация и NLU)
Последние достижения:
- (2019) Первое место на хакатоне Цифровой Прорыв в Самаре.
- (2021) Первое место на хакатоне TenderHack Самара 2021 кейс Распознавание неименованных сущностей.
- (2021) Первое место на хакатоне Лидеры Цифровой Трансформации в Москве 2021г - проект транскрибации и саммаризации встреч.
- (2021) Второе место на хакатоне StartupHack 12||21 онлайн кейс GroupIB.
- (2021) Четвёртое место VTB API Hackathon онлайн 2021 г - кейс анализ вредоносных вложений - движок анализатора XML.
- (2021) Участие в хакатоне hacks-ai \ Samara \ 2021, кейс Спасение жизней с помощью ИИ.
- (2022) Участие в хакатоне hacks-ai \ Ярославль \ 2022, кейс Прогнозирование риска развития сердечно-сосудистого заболевания пациента.
- (2022) Третье место на хакатоне Moscow City Hack 2022 кейс UralSib банка аналитический маркетинговый дэшборд для СММ отдела.
- (2022) Первое место на хакатоне Лидеры Цифровой Трансформации в Москве в 2022г - Сервис формирования задач для москвичей по контролю работ подрядчиков в сфере городского благоустройства. Описание: titanida_com/lct2022case8.
- (2022) Второе место на хакатоне TenderHack Москва 2022 кейс Разработка предиктивной системы для анализа ключевых метрик котировочных сессий на портале поставщиков.
- (2022) Первое место на хакатоне Лидеры Цифровой Трансформации 2022 в Москве. Кейс - Задача №8: Сервис формирования задач для москвичей по контролю работ подрядчиков в сфере городского благоустройства.
- (2023) Участие на хакатоне EVRAZ Hackathon 2023 кейс Цифровой двойник эксгаустеров агломашины и раннее предсказание его поломки.
- (2023) Участие в хакатоне Лидеры Цифровой Трансформации 2023 в Москве. Кейс - Задача №10: Сервис прогнозирования работ по содержанию и ремонту объектов городского хозяйства
Чем могу быть полезен:
В первую очередь меня интересуют DeepTech (высокотехнологичные стартапы в области AI: медицины, NLP, роботизации, чатботов, обработки информации, fintech) со сформированной идеей, MVP, проведенным custdev и проверенной, рабочей гипотезой - при совпадении каких-то из этих критериев мы найдем синергию.
- Могу помочь с оцифровкой вашей идеи в осмысленное техническое задание;
- Могу помочь с планированием архитектуры проекта, подготовкой MVP;
- Могу помочь с созданием визуальной части прототипа, UX (с точки зрения экспиренса пользователя — за дизайном - к дизайнеру :));
- Могу помочь с организацией процесса поиска и подбора команды;
Если вы ментор или ищете ментора, буду рад пообщаться.
Если вы разработчик, продакт или инвестор, дайте знать — набираю команду, контакты ниже.
Обучение:
- Московский инновационный кластер - Академия инноваторов;
- Образовательная платформа Маргулана Сейсембаева - Кайдзен планирование 2.0 + Power management;
- Маргулан Сейсембаев - Построение эффективной команды;
- Маргулан Сейсембаев - Целеполагание;
- Маргулан Сейсембаев - Эффективность;
Сообщества:
- Security-Band (https://security-band.com/)
- FutureAGI Syndicate
- Titanida Group (https://titanida.com)
- k0b1x team
- Good Genius team
- Интеллект Групп (https://intellectg.ru)
Мои open-source проекты:
(2017) StringHeur - Компонент (часть) эвристического движка для определения потенциально-вредоносных текстовых строк в (бинарных) файлах.
(2017) SkyChain - p2p децентрализованный e2e мессенжер с дизайном и боатми, как у Telegram. Читать подробнее с картинками.
(2018) Progress Antivirus - Десктопное приложение в виде GUI под Windows, часть антивирусной системы для обнаружения вредоносных объектов на основании эвристики, машинного обучения и системы белых и черных списков.
(2018) Progress Backer's Invest Panel - Frontend панель инвестора ICO\IDO\Token sale проекта Progress для реализации PRU токенов. / https://titanida.com/progresstokensale
(2018) IcoPixels.io - Проект попиксельной рекламы (современная версия легендарного сайта milliondollarhomepage.com) для проекта близких к blockchain, crypto-currency, ICO (TGE, Token Sale) и криптобиржам. / https://titanida.com/icopixels_io_en
(2019) HeartDesiseDetect, JustDoctor - наработки двух проектов по предсказанию сердечнососудистых и других заболеваний в рамках хакатонов hacks-ai.
(2020) JustDoctor - Веб сервис с элементами ИИ и NLP для определения вероятности летального исхода пациента в стационаре на основании его истории болезни. / https://titanida.com/justdoctor
(2020) BEC Email Analyser - Браузерное расширение для анализа и обнаружения входящей email корреспонденции на предмет спама, вредоносных вложений и подложных писем с элементами СИ на основе ИИ. / https://titanida.com/bec_email_analyzer
(2021) NFT Scanner - SaaS B2C\B2B сервис анализа NFT работ на предмет уникальности, степени похожести на чужие работы, проиндексированные в базе данных, анализ на плагиат и выдачу чужих работ за свои. (MVP проекта сделан в рамках хакатона Definition Насkathon в треке Rarible в команде SecurityBand). В проекте использовались алгоритмы кластеризации, нечетких хэшей (ssdeep), perceptual hash, avarage hash (MeanHash). Презентация проекта: https://cloud.mail.ru/public/qsDm/wm1BYYWdu. Демо проекта: https://youtu.be/EnmbVleOJwQ
(2021) XML Deep Analyser - Веб сервис \ беклогика для анализа входящих и исходящих сообщений содержащих XML файл на предмет вредоносных вложений. / https://titanida.com/xml_deep_analyser
(2022) BIQubic Marketing Dashboard - проект, объединяющий в себе информацию из социальных сетей компании и других источников. Обрабатываются посты, лайки, комментарии, реакции, репосты и видео. Извлечение идет из Youtube и Telegram каналов, VK, OK.ru, **gram, Яндекс и Google аналитики и объединяются с инструментами бизнес аналитики компании (PowebBI). Обрабатываемая в реальном времени информация позволяет управлять репутацией компании, анализировать вирусные посты и комментарии, анализирует эффективность работы маркетингового отдела в целом.
(2022) Платформа "Живой город" - позволяет оптимизировать работы со сметами по благоустройству, а также в короткие сроки подготовить данные для взаимодействия с ЕАИСТ. При работе со сметами используется информация из дополнительных классификаторов и справочников (ФИАС, ОКЕИ и т. д.).
(2023) RusTextMorpher v1.2 - Скрипт для офбускации и деперсонализации пользовательского текста. Позволяет гибко настраивать методы обфускации и возвращает результат в виде процента похожести оригинального и обфусцированного текста.
(2023) Цифровой двойник эксгаустеров - Как мы создавали цифровой двойник для агломерационной машина и делали предсказание неисправности, предназначенной для окускования железных руд и концентратов для доменной плавки путем их спекания на аглоленте под разрежением создаваемым эксгаустерами. Хакатон ЕВРАЗ 2023.
(2023) Платформа "Коммунальный Эксперт" - Эффективная прогностическая система управления жилищно-коммунальным хозяйством в масштабах города. Платформа «Коммунальный Экспер» агрегирует данные об объектах, инцидентах и ремонтных работах из различных источников, связывает их и обрабатвыает с целью рекомендаций по будущим работам для предотвращения или более быстрого реагирования на инциденты. Хакатон ЛЦТ 2023.
Контакты:
Email: progression.official🌍gmail.com
Github ссылка: https://bit.ly/3FSnvDS
Заметки в блоге:
https://titanida.com/OpenAI_plugins_LLaMA_plugins - Искусственный интеллект знакомят с реальным миром через плагины. Разбираемся с ChatGPT plugins - представьте себе мост, по которому любую нужную нейросети информацию, для более комплексного и точного ответа, подвозят и сгружают прямо в "мозг".
https://titanida.com/OpenAI_plugins_details - OpenAI ChatGPT Plugins - подробности и техническая инофрмация. В этой статье поделюсь конкретикой по основным плагинам, как они функционируют и что удалось узнать на текущий момент.
https://titanida.com/Signs_of_the_year - Мои итоги года в цифрах :: My signs of the year. Традиционно принято подводить итоги года. Я, как человек с техническим складом ума, просто обожаю всё оцифровывать и вести статистику.
https://titanida.com/CheckGPT_to_detect_ChatGPT - CheckGPT.app - Нейросеть для определения текста, сгенерированного большими языковыми моделями (ChatGPT, GPT3, BLOOM, you.com AI). Вводная часть, мотивация, риски, идея и реализация, возможности.
https://titanida.com/chatgpt_change_the_way_we_thinking - ChatGPT заставит нас многое переосмыслить, то как мы думаем, учимся, работаем и общаемся.
https://titanida.com/is_LaMDA_killer_of_ChatGPT - Google запускают LaMDA - убийцу ChatGPT.
https://titanida.com/ChatGPT_with_russian_tokenization_ruChatGPT - Мы выработали подход, при котором происходит процесс кодирования запроса в ChatGPT на русском в вектора на английском, и преобразовании векторов на английском в ответе от модели, обратно на русский язык, мы добились прямого общения с моделью без ограничения по входящей и исходящей длине векторов по всей базе знаний модели из датасета на английском языке.
https://titanida.com/HideGPTapp_to_mask_AI_generated_text - Что, если перед нами стоит противоположная задача: скрыть факт написания ChatGPT от сервисов проверки? Мы разобрались в этом вопросе и придумали алгоритм для сокрытия (маскировки) текста, написанного ИИ от всех существующих решений по обнаружению текстового ИИ контента! https://hidegpt.app/
https://titanida.com/AI_chatbots_become_alive_AGI - В больших языковых моделях начинает "проявляться" сознание? Как проявляется факт самосознания и самовосприятия у чатботов с искуственным интеллектом?