「Agent/智能体」可说是当今 AI 领域最炙手可热的话题。今天凌晨,OpenAI 发布了一系列可让开发者通过 API 构建智能体的新工具,其中最大的看点便是 Responses API⁠,这是对之前的 Chat Completions API 的一轮大升级,使其获得了 Assistants API 般使用工具的能力,从而 ...
GPT-5.4真正的杀招终于落地!OpenAI连夜重写基建、原生收编七大沙盒,彻底封死第三方框架的活路。旧时代的聊天玩具已被抛弃,工业级Agent全面觉醒。 OpenAI不声不响,又下了一手狠棋。 就在刚刚,Agents SDK迎来一次彻底的架构重写。 原生harness、原生沙盒、Codex级的文件系统工具,外加七家头部沙盒厂商一键接入。 3月初,GPT-5.4带着原生computer use( ...
更离谱的是,面对弹窗广告、钓鱼网站,甚至是试图绕过人机验证(reCAPTCHA)这种高危操作,Agent 们也是「勇往直前」。要是 ...
今天本想写篇关于 OpenAI Responses API 的文章,但近期 AI 热门话题挺多,感觉有必要简单聊聊。 Agent、MCP 近期频繁出现在大众视野,近日,OpenAI 又宣布推出 Responses API 助力开发者。术语名词越来越多,脑子明显感觉不够用了... AI Agent 是一个更广泛的概念,它通常 ...
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。 业界普遍认为,需要海量的轨迹数据或复杂的强化学习才能实现电脑智能体 ...
近日,来也科技 OpenAPA 框架在 Computer Use Agent 计算机操控智能体的权威基准 OSWorld 上取得 78.3% 的成绩,在 Agentic Framework 这一技术路线上位列全球第一。 OSWorld 是什么?Computer Use Agent 界的“高考” 如果说大语言模型的能力可以用 MMLU、GSM8K 这些考试衡量,那么AI 是否能像人一样操作电脑,标尺 ...
就在刚刚,OpenAI 发布了一系列专为构建 AI Agents 设计的新工具和 API,帮助开发者更容易创建能自动完成任务的 AI Agents(智能体)。 OpenAI 认为虽然过去一年推出的高级推理、多模态交互等模型能力为 Agent 奠定了基础,但开发者在构建生产级 Agent 时,还是会遇到 ...
当 AI 不再受限于单一指令,而是能像人类般操作软件、跨系统处理复杂任务,由 Computer Use 技术引发的变革正重塑数字化劳动未来。知名风投 a16z 指出,这一技术是 AI Agent 落地的关键突破,打破传统 AI 依赖 API 的局限,可实现端到端工作流自动化,更大胆预测 ...
2026年3月4日,GitHub上发生了一件让整个技术圈集体沉默三秒的事情。 一个开源项目,以28万Stars的成绩,正式超越了Facebook用十年时间打造的React框架,成为GitHub历史上Stars最多的软件项目之一。这个项目从第一行代码推送到GitHub,到超越React,总共用了不到60天。
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools ...