25 3 月, 2026

苹果发布 Ferret-UI Lite:轻量级 AI 模型革新手机界面理解

ferret-ui-lite-ai-

苹果公司近日在一篇最新的研究论文中,推出了名为 Ferret-UI Lite 的端侧 AI 模型。该模型仅有 30 亿参数,却在性能上匹配甚至超越了体积大 24 倍的大型模型。这一突破性进展标志着苹果在移动设备 AI 技术上的新里程碑。

Ferret-UI Lite 是专为移动设备设计的多模态大语言模型(MLLM),其“轻量级”特性使其能够在算力有限的手机端,精准理解并操作复杂的图形用户界面(UI)。在多项基准测试中,Ferret-UI Lite 的表现不仅追平,甚至超越了参数量高达其 24 倍的大型服务器端模型。

技术创新:推理时裁剪

在核心技术方面,Ferret-UI Lite 引入了“推理时裁剪”(Inference-time Cropping)技术,以解决通用大模型难以识别手机屏幕上微小图标和文本的问题。该模型在处理任务时,会先进行粗略预测,然后智能地“剪切”并放大相关区域,仿佛人眼凑近观察细节一样,从而实现精准识别。此策略使小模型无需处理海量图像数据,也能捕捉到界面中的关键信息,更好地理解屏幕元素。

训练机制:合成数据生成系统

为了应对高质量训练数据匮乏的挑战,苹果研究团队构建了一套合成数据生成系统。该系统由“任务生成器”、“规划器”、“执行者”和“批评者”四个角色组成,允许 AI 在模拟环境中不断尝试操作、犯错并自我修正。这种机制不仅生成了海量训练样本,还让模型学会了如何应对现实操作中的错误与意外情况,例如点击无反应或弹出干扰窗口。

“这种机制的效果远优于单纯依赖人工标注的清洁数据。”

隐私保护与未来展望

Ferret-UI Lite 的另一大优势在于其能够完全在本地运行,无需将屏幕截图上传至云端服务器。这不仅赋予手机“自动操作 App”的能力,同时也最大程度地保障了用户隐私。尽管测试结果显示该模型在执行短流程、基础 UI 操作时表现优异,但在处理复杂的多步长任务时仍有提升空间。

随着 Ferret-UI Lite 的发布,苹果在移动设备 AI 领域的创新步伐进一步加快。未来,这一技术有望在更多应用场景中得到推广,为用户带来更智能、更安全的使用体验。

在技术日新月异的今天,苹果的这一举措无疑为行业树立了新的标杆,也为其他科技公司提供了新的思路。

推荐阅读  QQ鸿蒙版App 9.2.5版本邀测升级,新增PC登录手机验证功能