Когда ИИ лезет к колбе: чему учит бенчмарк LabSafety Bench

Исследователи представили LabSafety Bench — крупный бенчмарк для проверки, насколько безопасно большие языковые и мультимодальные модели обращаются с лабораторными экспериментами. 19 современных ИИ протестировали на 765 тестовых вопросах и 404 реалистичных сценариях (3128 открытых задач) по трём направлениям: выявление опасностей, оценка рисков и прогноз последствий. Ни одна модель не смогла стабильно распознавать угрозы даже на уровне 70% точности. При этом закрытые модели лучше справляются с тестами формата multiple choice, но теряют преимущество в свободном рассуждении. Работа подчёркивает: прежде чем пускать ИИ в реальные лаборатории — от университетских до крупных научных центров в России и мире — нужны специализированные методики оценки и усиленные механизмы безопасности.

15 января 2026 г. · 3 минуты · ТехЛайв

Claude Cowork: офисный помощник, который сам просит не доверять ему лишнего

Anthropic запустила исследовательский предпросмотр Claude Cowork — ИИ-ассистента, который может автоматизировать рутину на рабочем столе, в файлах и веб‑приложениях. Разбираемся, как он устроен, зачем нужен и почему разработчики одновременно уговаривают им пользоваться и настойчиво предупреждают об опасности утечек и prompt‑injection.

14 января 2026 г. · 2 минуты · ПроТехник

Когда ИИ — свой парень, но с пропуском от суперпользователя

Почему в 2026‑м главная инсайдерская угроза — не обиженный админ, а ваш собственный ИИ‑агент. Что говорит Palo Alto Networks, чем тут пахнет «цифровым двойником» CEO и как не превратить помощника в предателя.

4 января 2026 г. · 2 минуты · ТехЛайв

Полмиллиона за поводок для ИИ: вакансия, от которой дрожит ChatGPT

OpenAI ищет нового «главу готовности» — человека, который за $555 тысяч в год должен удерживать стремительно развивающийся искусственный интеллект от вреда людям. Почему эта должность меняется чаще, чем пароли у параноика, и какое отношение к этому имеют психика пользователей и гонка ИИ‑держав?

30 декабря 2025 г. · 2 минуты · CyberЛаб

Секретный фикс, утренний ступор и база без замков

Как медицинская клиника страдала от тайных «лечений» вендора в рабочие часы и почему доступ «ALL ALL ALL» к базе с пациентами — это диаграмма катастрофы.

5 декабря 2025 г. · 2 минуты · ПроТехник