Как DeepSeek создает новые (мета)математические теории
Вместо краткого введения. Активно использую в работе DeepSeek уже чуть больше двух недель, очень доволен им и в целом продуктивность и скорость работы выросли. Но рассказать хотелось бы не об этом, точнее, не совсем об этом.
Фундаментальные науки и ИТ: создание исследовательского центра в коммерческой организации
Развитие информационных технологий — от первых алгоритмов до нейросетей — всегда опиралось на открытия, сделанные в рамках «чистой» науки. Математические теории, исследующие абстрактные структуры, превращались в языки программирования. Квантовая физика, изучающая поведение частиц, подарила миру транзисторы и лазеры. Даже современный искусственный интеллект, кажущийся вершиной прикладных разработок, обязан своим существованием дисциплинам, которые столетиями развивались без очевидной цели:Математика — алгоритмы машинного обучения (теория вероятностей, линейная алгебра).Биология
Исследователи из Оксфорда предложили принципиально новый способ обучения нейросетей
Абсолютно все нейросети, которые нас окружают, обучены с помощью одного и того же алгоритма – алгоритма обратного распространения ошибки (англ. back-propagation). Его изобрели еще в 80-х годах прошлого века ученые Дэвид Румельхарт, Джеффри Хинтон (ныне нобелевский лауреат) и Рональд Уильямс. Идея back-propagation в том, что мы сначала «прогоняем» входные данные вперёд по сети (forward pass), получаем предсказания и вычисляем их ошибку, а затем прогоняем сигнал ошибки назад по сети (backward pass), чтобы вычислить градиенты и обновить веса. Это работает хорошо и надежно, но есть нюансы
Рекурсивно самовычисляющая Вселенная Стивена Вольфрама – теория всего или теория чего угодно?
«Я думаю, что вычислениям суждено стать определяющей идеей нашего будущего» (Стивен Вольфрам)«
Рекурсивная Гипотеза Реальности – от аксиомы к сильному ИИ. Статья 1
Фрактал МандельбротаЧто, если реальность — это алгоритм, который пишет сам себя?
Precision и recall для каждого от кофаундера Технолиума
Всех приветствую! Далее я объясню и покажу как можно подбирать порог на практике и что это вообще такое на пальцах. Но для начала немного теории. Внимание! если вы не знаете что такое метрика или оценка модели или бинарный классификатор, для начала почитайте об этом!Матрица ошибок (confusion matrix)Для лучшего понимания предлагаю ввести понятие матрицы ошибок для оценки качества классификатора:Реальные таргетыПредсказания модельюPositive
Мультимодальные языковые модели: как нейросети учатся видеть и слышать
Мультимодальные языковые модели представляют собой самый прогрессивный класс нейросетевых архитектур, объединяющих способность воспринимать и обрабатывать различные типы данных одновременно - текст, изображения, аудио и видео. Это похоже на то, как наш мозг интегрирует информацию из разных органов чувств, чтобы создать полную картину мира. Как сказал философ Марсель Пруст, “Настоящее открытие не в том, чтобы увидеть новые земли, а в том, чтобы иметь новые глаза”.▍ Фундаментальные принципы мультимодальных моделей
А не пора ли нам подкрепиться?
Краткое содержание предыдущих серийВ заметке про Pointer Network было много всего: нетривиальная архитектура кодировщика (энкодера) и декодера, механизм внимания, а также совсем немного про обучение с подкреплением. В общем, много-много всякого, нужного для охвата пазла целиком. Далее, в следующей заметке
Эконофизика и физически-обоснованные нейронные сети
Эконофизика — область науки, которая объединила в себе экономическую теорию и физические методы. По случаю выхода нашей с коллегами научной статьи , решил рассказать об этой концепции. Особенно про то, как современные подходы машинного обучения могут способствовать построению динамических моделей.Историческая справкаВпервые термин эконофизика