HASHKFK
od体育官方网站注册网址,od体育app官网下载,od体育最新登录网址,od体育平台,od体育app,od体育app下载,od体育靠谱吗,od体育,od体育下载,od体育官方网站,od体育官网,od体育投注,od体育下注,od体育买球,od体育世界杯,od体育欧洲杯,od体育赛事,od体育开户,od体育注册,od体育登录,od体育入口核心差异对比,API Agent与GUI Agent各有千秋。对比了两种范式的技术路线差异,GUI Agent的核心优势在于通用性高,在可靠性、性能、隐私风险角度则是API Agent更胜一筹。1)通用性: GUI Agent的通用性显著更高,这是核心优势,不需要App 开发者进行适配。理论上只要是人类能够使用的 App,GUI-Agent 都能使用。解决了应用覆盖率的问题,新功能或未暴露功能的适配度也更高。2)可靠性;GUI Agent的可靠性仍然较低。原因包括模型对复杂界面的识别能力还达不到百分百;需要多步骤模拟用户操作,整体任务失败率更高;UI 改版时容易失效。3)性能:API Agent 可以一次调用完成复杂任务,后端直接驱动执行效率高。GUI Agent性能较低,完成简单任务可能需要多次截图分析、视觉推理等复杂计算,算力消耗更大。截图上传到云端模型时,数据量通常高于API传输参数,延迟也更高。4)隐私风险:API-Agent 的应用端后台可进行精细的数据和权限管理,权限边界清晰。GUI-Agent 的隐私风险较高。它需要读取屏幕内容,容易暴露聊天记录、密码、验证码等敏感信息。除了技术问题,商业阻力上我们认为GUI Agent不经过授权,更容易受到应用厂商的抵触。
商业形态演变:三方博弈与生态重构。手机Agent的兴起意味着移动互联网流量的重新洗牌,手机厂商、大模型厂商和应用厂商三方势力将展开复杂的博弈。手机厂商有望从硬件售卖进一步获取流量入口的价值,OS成为了用户意图的第一接收者。类似于搜索广告可能演变成一种新的竞价模式。大模型厂商的愿景是打造一个全能的App(如ChatGPT、豆包)。用户在这个App里通过对话完成所有需求。把将其他App变成自己的后端数据库和工具。大模型厂商会积极寻求与二线手机厂商合作。字节跳动与中兴的合作就是典型案例。应用厂商,一方面可能与手机/模型厂商合作,开放部分能力接口;另一方面,为保护自身利益,也可能拒绝或限制Agent的接入。Agent的授权边界是需要进一步划分的法律问题。App自身也在Agent化,例如微信最终会推出一个AI智能体,淘宝也在尝试通过“问问”等功能在App内实现自然语言导购。我们认为手机Agent的发展不会是API或GUI的单选题,对于高价值、涉及敏感数据的操作(如支付、通讯、核心业务流),API Agent有更高的准确度和隐私保护。对于只读、信息查询类的需求,以及API尚未覆盖的应用,GUI Agent通过视觉理解的方式运行可以更灵活通用。为了解决延迟和隐私问题,未来的手机处理器预计还将进一步优化视觉模型的推理能力,使GUI识别和决策在端侧完成,不再上传云端。
2025年12月1日,字节发布豆包手机助手预览版。这是一个面向手机厂商的系统级服务,它将豆包大模型深度融入操作系统,让用户只需动嘴(或动一下手指),就能指挥手机去执行那些原本需要点击几十次屏幕的繁琐操作。功能包括跨平台比价点外卖、搜小红书做攻略等。豆包手机助手的主力研发团队,是字节负责 AI 硬件的 Ocean,它隶属于字节 AI 产品大部门 Flow,主要成员来自字节多年来先后收购的一些硬件产品团队,如锤子手机、VR 头显 PICO、智能耳机 Ola Dance 等,以及近年加入字节的手机、硬件从业者。这款豆包与中兴合作的手机已在豆包手机助手官网及中兴商城上架,售价 3499 元。这款手机只是豆包手机助手的 “打样”。字节正和多家手机厂商谈合作。