6 11 月, 2025

科大讯飞推出多模态数字人“小飞”及百变声音复刻技术

unnamed-file-153

IT之家 11 月 6 日消息,在今日的 2025 科大讯飞 1024 开发者节上,科大讯飞发布了一款全新的多模态数字人“小飞”,并宣布了业界首发的“百变声音复刻”技术。

科大讯飞表示,这款具备高度多模态交互能力的数字人导览“小飞”正式亮相并已投入使用。与传统的数字助手不同,“小飞”突破了简单问答的局限,能够实现多人自由对话、多语种交流,并具备个性化记忆能力,能够记住访客的历史信息并进行贴心提醒。此外,“小飞”还能秒变“林黛玉”等多种虚拟形象,提供更丰富的服务。

多模态交互的突破

科大讯飞董事长刘庆峰在发布会上指出,通过融合远场识别、3D 视觉感知、情感语义理解等八项核心能力,“小飞”展示了人工智能不再是简单的应用程序,而是能够走进真实物理空间、提供有情感、有深度服务的“类人”伙伴。

这一发展标志着人工智能技术在多模态交互领域的又一次突破。传统的数字助手通常依赖于单一的语音或文本交互,而“小飞”通过整合多种感知和理解能力,能够在复杂的场景中提供更自然和人性化的互动体验。

百变声音复刻技术的创新

与此同时,科大讯飞还宣布推出基于星火语音大模型的“百变声音复刻”技术。用户仅需一句录音即可高保真复刻任意音色,再通过一条指令便可创造任意风格。

这项技术的突破,有望为数字人、有声读物、内容创作等领域带来变革,让每个人都能创造专属声音。

声音复刻技术的推出,展示了科大讯飞在语音合成领域的领先地位。通过这项技术,用户不仅可以轻松复制和创造声音,还可以在各种应用场景中实现个性化的声音体验。

技术发展的未来展望

随着“小飞”和“百变声音复刻”技术的推出,科大讯飞在人工智能领域的创新步伐不断加快。这一系列新技术的应用,不仅丰富了数字人的功能,也为未来的智能交互提供了更多可能性。

业内专家认为,这些技术的突破将进一步推动人工智能在日常生活中的应用,从而改变人们与技术互动的方式。未来,随着技术的不断成熟和普及,数字人有望在更多领域中发挥作用,为用户提供更智能和个性化的服务。

科大讯飞的这一举措,不仅展示了其在技术创新方面的实力,也为行业树立了新的标杆。随着人工智能技术的不断发展,我们可以期待看到更多类似的创新,为我们的生活带来更多便利和惊喜。

推荐阅读  精控能源与Lion Power深化北美市场战略合作