Топ парсеров и API-сервисов сбора данных: сравнение скорости, масштабируемости и обхода защит — парсеры на максималках
Автоматический сбор данных (парсинг сайтов, или web scraping) стал неотъемлемой практикой для разработчиков, аналитиков и автоматизаторов. С его помощью получают массовую информацию с сайтов – от цен конкурентов и отзывов до контента соцсетей. Для этого разработано множество “парсеров” – библиотек, фреймворков и облачных сервисов, которые позволяют извлекать веб-данные программно. Одни решения требуются для быстрого парсинга статичных страниц, другие – для обхода сложной JavaScript-навигации, третьи – для получения данных через API. В этой статье я рассмотрю топ инструментов для парсинга сайтов
Microsoft Research разработала новый способ включения знаний в LLM
Microsoft Research разработала более эффективный способ включения внешних знаний в языковые модели. Новая система, называемая Knowledge Base-Augmented Language Models (KBLaM), использует подход plug-and-play, который не требует изменения существующих моделей.
Когда ИИ закрывает глаза: Путешествие между воображением и галлюцинациями
Когда ИИ закрывает глаза: Путешествие между воображением и галлюцинациями Введение
Один день
Грейс проснулась от мелодичной трели, раздавшейся в комнате. Одновременно с этим пришли в движение занавески, открывая окна и впуская внутрь лучи утреннего солнца. Кофемашина, пшикнув, начала готовить кофе, а мультиварка — еду. Всё как всегда по утрам: давно настроенные алгоритмы пробуждения перед работой.Быстро накинув халат, Грейс пошла в душ. Стоя под тугими струями воды, она размышляла, стоит ли сегодня идти на работу. На самом деле, не особо хотелось.
ИИ открыл двери для массовой прослушки населения
Шпионаж (прослушка) и наблюдение (слежка) — это разные, но связанные вещи. Если нанять частного детектива для прослушки, то он может спрятать несколько жучков в доме, машине — и в итоге получит отчёт с записями разговоров объекта. Если же ему поручили работу по наблюдению, то содержание отчёта будет другим: куда ходил человек, с кем разговаривал, что покупал, что делал. До появления интернета установить за кем-то наблюдение было дорого и долго. Нужно было вручную следить за человеком, отмечая, куда он ходит, с кем разговаривает, что покупает, что делает и что читает. Но этот старый мир навсегда ушёл в прошлое. Теперь наши телефоны отслеживают местоположение, банковские карты регистрируют покупки, приложения отслеживают, с кем мы разговариваем и что читаем. Компьютеры собирают данные обо всех наших действиях, и по мере удешевления хранения и обработки эти данные всё чаще сохраняются и используются. То, что было индивидуальной работой, сейчас стало массовым. Слежка за людьми стала бизнес-моделью для интернет-компаний, и у нас нет разумного способа отказаться от неё.
Поиск Gmail получит обновление на основе ИИ, которое позволит быстрее показывать «наиболее релевантные результаты»
Google объявила о запуске новой функции для поиска в Gmail. Функция на базе ИИ «покажет самые релевантные результаты быстрее».
Профайлинг уровня эксперт или голодные игры по HR’овски
ВведениеДобрый день, уважаемые читатели Хабр.ру! Мы продолждаем серию публикаций по хакатонам, в которых активно участвуем, и прошу заметить, получаем призовые места !!! Сегодня речь пойдет об одной их наших команд (MMG-2), которые отлично выступили на хакатоне ФИЦ-2024 и завоевали третье место (бронзовая медаль), тем самым обеспечив себе место в тройке лидеров и завоевав свою первую победу. К слову будет сказано, ребята провели уже 3 свой хакатон и добились успеха, показав отличный результат и, что самое главное, прокачали свой скилл, навыки работы в команде, а также вошли в большой бизнес.
Экскурсия
Пашка исчез, когда мы продали третий город. Ну, не целый город, конечно. Просто экскурсию по историческому центру, с элементами дополненной реальности. Это уж я, как истинный пиар-менеджер, стала звать наши допы «городами».Первым был Питер. Для него у Петьки с Пашкой было уже много отдельных локаций нарисовано, оставалось только объединить в один маршрут. Ну и выиграть муниципальный тендер. Дальше сделали Новгород – заказала мелкая турфирма, денег с гулькин клюв, зато красивый кейс для презентаций.
Кай-Фу Ли переориентирует 01.AI на решения Deepseek, называя их экзистенциальной угрозой для OpenAI
Бывший глава Google China Кай-Фу Ли переориентирует свой стартап в сфере искусственного интеллекта 01.AI на полное внедрение моделей Deepseek с открытым исходным кодом, описывая их как экзистенциальный вызов бизнес-модели OpenAI.