当谷歌双子座手机助手或者豆宝手机助手在屏幕上独立与不同应用进行交互时,一项名为GUI的AI技术根源正在悄然改变着智能代理的部署逻辑。对此,北京航空航天大学人工智能研究院沙磊教授近日表示,GUI路线本身就是AI的重要创新范式,在理解用户意图和解决大规模长尾场景下的问题方面带来了长足进步。通过读取屏幕上的信息,利用代理的能力分解用户需求,并在用户明确批准的情况下完成各种任务,GUI路线直观地向用户展示代理的所有流程能力,从理解意图、分解任务、验证数据执行,直到最终完成需求。该技术路线的主要优点是其广度。沙磊先生强调GUI路径可以有效释放生产力,促进用户认证范围内数据流通的简化,尤其是在涉及多方服务协调的复杂任务中。同时可以激活更多“小而美”的服务商,促进AI生态和经济的整体发展。相对于API路线受到协议耦合、业务合作、生态闭合等因素的限制,GUI路线在解决API短期难以覆盖的长尾问题上展现出独特的价值。它可以打破现有壁垒,加速人工智能的全面应用,促进生态系统的开放和融合。隐私和安全是任何人工智能代理开发中的基本问题。沙磊表示,GUI代理在技术层面具备保护用户隐私和数据安全的能力,只要做好这三个方面他的工作正在进行。所有操作均基于用户认可,任务分解和执行可视、可感知、可控。用户数据在传输、存储等过程中均经过严格加密,个人信息保密、匿名。此外,内部专业团队进行隐私影响评估、合规测试等多重保护,降低机制隐私泄露风险。事实上,GUI 和 API 并不是一种或另一种技术。两者在智能体意图识别、任务分解等方面面临着相似的安全风险。这也是AI代理行业整体发展需要行业共同面对和共同解决的重要一点。从全球范围来看,GUI路线已经成为科技巨头的探索方向。谷歌推出了Gemini移动助手,并提供了GUI相关的技术解决方案。全球技术OpenAI和微软等技术公司正在通过文章和产品演示积极探索GUI的方向。沙磊分析道,API路线更有利于大厂家牵头制定标准,提高自身环境效益。而GUI路线则注重用户体验和场景实现,更接近综合AI价值取向。在国内,豆宝手机助手引领了GUI实现路径,众多厂商纷纷效仿并开源相关功能,为行业发展注入新的活力。展望未来,人工智能代理要想真正保护用户权益,就需要遵守用户知情、事先同意的原则。关键原则包括权利、事中知情、事中控制、事后核实,严格遵循数据最小化、目的再利用等要求。严格、安全加密以及协调的设备和云保护。目前,整个行业还处于起步阶段。隐私、合规性和问责制是所有技术路径中必须尊重的基础。路线之间没有区别。 GUI和API都必须经过用户批准才能运行,严格保护用户数据,并遵守国家法律法规。只有让人工智能在安全、可控、可解释的前提下为用户服务,才能为用户提供更可靠、更人性化的服务,以更丰富的应用生态驱动人工智能的经济价值。文/校对:罗伊丹穆湘桐