Threshold U-Net: как мы отказались от высокого разрешения и выиграли в скорости бинаризации
Хоть современный ИИ уже почти в состоянии написать симфонию и превратить холст в шедевр, некоторые простые задачи все еще не так просты, если наложить ограничения на решение. Так как главной задачей у нас, в Smart Engines, является распознавание и оцифровка документов
Клон ChatGPT в 3000 байтах на C, основанный на GPT-2
Эта программа представляет собой свободную от зависимостей реализацию GPT-2. Она загружает матрицу весов и файл BPE из оригинальных файлов TensorFlow, токенизирует вывод при помощи простого энкодера, работающего по принципу частотного кодирования, реализует базовый пакет для линейной алгебры, в котором заключены математические операции над матрицами, определяет архитектуру трансформера, выполняет инференс трансформера, а затем очищает вывод от токенов при помощи BPE-декодера. Всё это — примерно в 3000 байт на C.
Loss Landscape Analysis — новая библиотека для анализа точности обучения и оценки обобщающей способности нейросетей
Мой коллега Никита Габдуллин работает в Отделе перспективных исследований ИТ-компании «Криптонит». Он автор библиотеки Loss Landscape Analysis (LLA) и научной статьи о ней, препринт которой доступен на английском языке. Здесь мы подробнее рассказываем о самой библиотеке, в то время как научная публикация в основном посвящена исследованию разных свойств ландшафтов функций потерь. Также в русскоязычной статье мы допускаем некоторые лингвистические вольности, которые не приняты в академической среде, но упрощают восприятие текста.
Анализ обработки признаков в YOLO NAS S при помощи CAM
Методы объяснения моделей — практичный инструмент для понимания модели, оценки её точности и стабильности. Однако, часто можно столкнуться с ситуацией, когда фреймворк, в котором метод реализован, просто не "дружит" с реализацией модели. В этом туториале хочу подробно показать CAM (class activation map) для объяснения моделей зрения. Почему CAM?Class Activation Maps (CAM) — базовый инструмент для визуализации того, какие области изображения наиболее важны для модели при принятии решения. Он позволяет понять:Какие признаки извлекает модель на разных слоях свертки;
Как нейронки помогают студентам в обучении — и где обычно подводят
Привет! Это Алина Веденская из команды образовательных проектов МТС Диджитал.Помните Гермиону Грейнджер из «Гарри Поттера»? Знания она добывала из огромных стопок книг и старинных рукописей, которые находила в библиотеках. Жизнь современных студентов точно не такая пыльная: информация упакована в ноутбук, а рутинные задачи можно поручить ИИ. Как раз о последнем и пойдет речь в этом посте.Недавно моя коллега рассказывала
Как «Писец» на Тотальный диктант ходил
В 2024 году состоялся юбилейный, десятый Тотальный диктант. Тогда на него пришёл «Писец». Вы не подумайте, не произошло ничего плохого. «Писец» — это открытая система автоматической расшифровки речи, от журналистского интервью до заседания диссертационного совета. Будто древнерусский пи́сец, который записывает за боярином всё, что тот говорит, и затем сохраняет в виде структурированного текста с таймингами.
Самураи искусственного интеллекта
В одной из предыдущих статей я уже упоминал нобелевского лауреата по физике 2024 года Джеффри Хинтона (праправнук Джорджа Буля). Вторым лауреатом стал Джон Хопфилд. Сеть Хопфилда
Temporal Fusion Transformer: улучшение прогнозирования в ритейле с минимальными затратами
Всем привет! Меня зовут Дмитрий Поляков, я работаю аналитиком данных в команде ad-hoc аналитики X5 Tech. В этой статье мы хотели бы рассмотреть задачу прогнозирования, которая является чрезвычайно важной задачей в ритейле. Точные прогнозы позволяют оптимально планировать объёмы товаров и запасы, распределять бюджет, устанавливать бизнес-цели и решать множество других задач. В X5 применяются десятки моделей прогнозирования, каждая из которых помогает решать конкретные задачи.
Основы ИИ: введение в искусственный интеллект
Привет, дорогие читатели Хабра! Сегодня я хочу поговорить с вами об основах искусственного интеллекта. ИИ - это увлекательная сфера, которая стала неотъемлемой частью нашей жизни. Вместе мы изучим, что такое искусственный интеллект, как он работает и как его применяют в современном мире.Ключевые выводы:Искусственный интеллект
Как машинное обучение объясняет реальный мир
Природа мира склонна повторять себя, например: каждый раз, когда возникает вопрос об эффективном использовании ограниченных ресурсов, мы изобретаем кэши. Компьютеры, иерархии компаний, DNS — все это примеры того, как одни и те же подходы вновь и вновь используются для решения схожих задач. Эта фрактальная природа мира объясняет, почему обучение нейронных сетей так похоже на человеческое: и там и там базовая структура это нейронная сети.