Google представила Gemini 3 Deep Think — мощный ИИ для науки, который всё ещё «подгоняет» задачи под ответ - «Новости сети» » Основы Интернет

Google представила Gemini 3 Deep Think — мощный ИИ для науки, который всё ещё «подгоняет» задачи под ответ - «Новости сети»

14:30, 13-фев-2026
Новости мира Интернет
Benson
0

Обзор игрового QD-OLED WQHD-монитора Gigabyte AORUS FO27Q5P: на пределе возможностей

Итоги 2025 года: почему память стала роскошью и что будет дальше

Обзор ноутбука TECNO MEGABOOK S14 (S14MM): OLED с HDR как новая норма

Обзор телевизора Sber SDX-43U4169

Обзор игрового 4K IPS-монитора Gigabyte M27UP: разнообразия ради

Итоги 2025-го: ИИ-лихорадка, рыночные войны, конец эпохи Windows 10 и ещё 12 главных событий года

Google представила Gemini 3 Deep Think — мощный ИИ для науки, который всё ещё «подгоняет» задачи под ответ - «Новости сети»

Источник изображений: Google

Разработка новой версии Google Gemini 3 Deep Think велась совместно с учёными — сервис призван решать сложные исследовательские задачи, чьи аспекты могут не иметь чётких ограничений или единственного правильного решения, а сопутствующие данные — быть неполными или несистематическими. Обновлённая платформа Deep Think — это попытка выйти за рамки абстрактной теории и выйти в область практического применения. Новый режим доступен прямо в приложении Gemini, но воспользоваться им могут только подписчики Google AI Ultra; компания также впервые откроет доступ к сервису через API Gemini — инженерам, исследователям и предприятиям потребуется подать соответствующую заявку.

В тесте Humanity’s Last Exam платформа Google Gemini 3 Deep Think набрала 48,4 % без использования сторонних инструментов; результат в бенчмарке ARC-AGI-2 составил беспрецедентные 84,6 %. В тесте на программирование Codeforces рейтинг Эло составил 3455; в задачах Международной математической олимпиады 2025 года система показала уровень золотой медали, того же результата она достигла в решении задач олимпиад по химии и физике. В тесте CMT-Benchmark режим Google Gemini 3 Deep Think продемонстрировал высокий уровень владения теоретической физикой при результате 50,5 %.

Модель Gemini 3 Deep Think легла в основу ИИ-агента, который в лаборатории Google DeepMind получил название Aletheia. Он включает средство проверки гипотез, изложенных естественным языком, для выявления недостатков в предлагаемых решениях; предусмотрен итеративный процесс генерации и корректировки решений. Что важно, агент может признать свою неспособность дать ответ на запрос. Для работы со сложными исследованиями он обращается к поисковой службе Google и средствам веб-навигации — при подготовке сводок по опубликованной литературе он не выдаёт несуществующих ссылок и стремится избегать неточностей при вычислениях.

Фактические и перспективные уровни достижений Aletheia разработчики Google распределили по пяти градациям. В практически полностью автономном режиме ИИ-агент наметил пути решения трёх открытых задач, сформулированных математиком Палом Эрдёшем (Pál Erdős) — это исследование оценили на нулевом уровне, соответствующем «незначительной новизне». В том же режиме он предложил решение ещё одной задачи из того же набора, достигнув первого уровня или «минимальной новизны». На втором уровне, «пригодном для публикации» Aletheia показал результаты в автономном режиме, режиме сотрудничества с человеком и режиме вспомогательного инструмента. Третий («значительный прорыв») и четвёртый («знаменательный прорыв») ИИ-агенту пока не покорились.

По заданию разработчиков Aletheia проанализировал 700 нерешённых до сих пор математических задач Эрдёша и осилил 13 из них. Правда, у 9 задач нашлось уже существовавшее решение, а действительно впервые решёнными выглядят лишь 4 задачи. Более того, из 212 решений, которые выдал ИИ, оказались «содержательно правильными» лишь 6,5 %. Остальные либо имели фундаментальные недостатки (68,5 %), либо решали неправильно интерпретированные агентом версии исходных задач (31,5 %).

В результате разработчики согласились, что их ИИ демонстрирует «склонность неверно понимать вопрос таким образом, чтобы на него было легче ответить» и остаётся «крайне подверженным ошибкам по сравнению с людьми». Иными словами, заменить математиков ИИ пока не может.

Компания Google выпустила крупное обновление Gemini 3 Deep Think — платформы на основе рассуждающего искусственного интеллекта, предназначенной для решения актуальных задач в области науки и инженерного дела. Обзор игрового QD-OLED WQHD-монитора Gigabyte AORUS FO27Q5P: на пределе возможностей Итоги 2025 года: почему память стала роскошью и что будет дальше Обзор ноутбука TECNO MEGABOOK S14 (S14MM): OLED с HDR как новая норма Обзор телевизора Sber SDX-43U4169 Обзор игрового 4K IPS-монитора Gigabyte M27UP: разнообразия ради Итоги 2025-го: ИИ-лихорадка, рыночные войны, конец эпохи Windows 10 и ещё 12 главных событий года Источник изображений: Google Разработка новой версии Google Gemini 3 Deep Think велась совместно с учёными — сервис призван решать сложные исследовательские задачи, чьи аспекты могут не иметь чётких ограничений или единственного правильного решения, а сопутствующие данные — быть неполными или несистематическими. Обновлённая платформа Deep Think — это попытка выйти за рамки абстрактной теории и выйти в область практического применения. Новый режим доступен прямо в приложении Gemini, но воспользоваться им могут только подписчики Google AI Ultra; компания также впервые откроет доступ к сервису через API Gemini — инженерам, исследователям и предприятиям потребуется подать соответствующую заявку. В тесте Humanity’s Last Exam платформа Google Gemini 3 Deep Think набрала 48,4 % без использования сторонних инструментов; результат в бенчмарке ARC-AGI-2 составил беспрецедентные 84,6 %. В тесте на программирование Codeforces рейтинг Эло составил 3455; в задачах Международной математической олимпиады 2025 года система показала уровень золотой медали, того же результата она достигла в решении задач олимпиад по химии и физике. В тесте CMT-Benchmark режим Google Gemini 3 Deep Think продемонстрировал высокий уровень владения теоретической физикой при результате 50,5 %. Модель Gemini 3 Deep Think легла в основу ИИ-агента, который в лаборатории Google DeepMind получил название Aletheia. Он включает средство проверки гипотез, изложенных естественным языком, для выявления недостатков в предлагаемых решениях; предусмотрен итеративный процесс генерации и корректировки решений. Что важно, агент может признать свою неспособность дать ответ на запрос. Для работы со сложными исследованиями он обращается к поисковой службе Google и средствам веб-навигации — при подготовке сводок по опубликованной литературе он не выдаёт несуществующих ссылок и стремится избегать неточностей при вычислениях. Фактические и перспективные уровни достижений Aletheia разработчики Google распределили по пяти градациям. В практически полностью автономном режиме ИИ-агент наметил пути решения трёх открытых задач, сформулированных математиком Палом Эрдёшем (Pál Erdős) — это исследование оценили на нулевом уровне, соответствующем «незначительной новизне». В том же режиме он предложил решение ещё одной задачи из того же набора, достигнув первого уровня или «минимальной новизны». На втором уровне, «пригодном для публикации» Aletheia показал результаты в автономном режиме, режиме сотрудничества с человеком и режиме вспомогательного инструмента. Третий («значительный прорыв») и четвёртый («знаменательный прорыв») ИИ-агенту пока не покорились. По заданию разработчиков Aletheia проанализировал 700 нерешённых до сих пор математических задач Эрдёша и осилил 13 из них. Правда, у 9 задач нашлось уже существовавшее решение, а действительно впервые решёнными выглядят лишь 4 задачи. Более того, из 212 решений, которые выдал ИИ, оказались «содержательно правильными» лишь 6,5 %. Остальные либо имели фундаментальные недостатки (68,5 %), либо решали неправильно интерпретированные агентом версии исходных задач (31,5 %). В результате разработчики согласились, что их ИИ демонстрирует «склонность неверно понимать вопрос таким образом, чтобы на него было легче ответить» и остаётся «крайне подверженным ошибкам по сравнению с людьми». Иными словами, заменить математиков ИИ пока не может.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.

Иллюстрация к статье - Яндекс. Картинки.

Есть вопросы. Напишите нам.

Общие правила поведения на сайте.

Другие новости

Комментарии (0)

Уважаемый посетитель нашего сайта!
Комментарии к данной записи отсутсвуют. Вы можете стать первым!

✔ Новости мира Интернет

Рынок кадровых агентств Москвы в 2026 году: рейтинг,..

14:13, 27-июл-2026
Новости мира Интернет
Administrator
0

Москва остается крупнейшим рынком рекрутинговых услуг в России. По оценке аналитиков независимого рейтинга «ТОП Кадров», по состоянию на апрель 2026 года в столице...

Intel подтвердила возвращение Hyper-Threading в чипах Coral..

14:30, 26-июл-2026
Новости мира Интернет
Allford
0

Свою реализацию технологии «одновременной многопоточности» (SMT) компания Intel называет Hyper-Threading. Речь идёт о методе, при котором одно ядро может совмещать...

Apple и Micron заставляют администрацию Трампа выбирать:..

14:30, 26-июл-2026
Новости мира Интернет
Macduff
0

Противостояние двух американских компаний — Apple и Micron Technology — ставит президента США перед непростым выбором. В то время Apple намерена снизить растущие...

Глава игрового бизнеса Amazon убеждён, что кризис памяти..

14:30, 26-июл-2026
Новости мира Интернет
Green
0

Дефицит памяти сказался на стоимости не только игровых консолей и ПК, но и смартфонов, но обходиться без последних люди в большинстве своём уже не могут, а вот та же...

На форумах Steam обнаружили приманки для ClickFix-атак - «Новости»..

Злоумышленники публикуют на форумах Steam фальшивые решения для различных проблем с играми и Windows. На самом деле такие ко…...

Новости

Афоризмы

Самоучитель CSS

Обратная связь

Основы Интернет - технологий.

Будьте в курсе всех технологий.

Новости

Афоризмы

Самоучитель CSS

Обратная связь

Обзор игрового QD-OLED WQHD-монитора Gigabyte AORUS FO27Q5P: на пределе возможностей

Итоги 2025 года: почему память стала роскошью и что будет дальше

Обзор ноутбука TECNO MEGABOOK S14 (S14MM): OLED с HDR как новая норма

Обзор телевизора Sber SDX-43U4169

Обзор игрового 4K IPS-монитора Gigabyte M27UP: разнообразия ради

Итоги 2025-го: ИИ-лихорадка, рыночные войны, конец эпохи Windows 10 и ещё 12 главных событий года

Другие новости

Рекомендуем

Комментарии (0)

Похожие новости дня

Видео уроки

Популярное

✔ Новости мира Интернет

ВАША РЕКЛАМА

Разное но интересное