据IT之家报道,快手旗下的可灵AI于9月18日发布了一项新功能——数字人。用户只需提供一张角色图片以及一段文字或音频,便可生成高达1080p分辨率、48帧每秒、最长1分钟的视频。目前,该功能正在进行公测,逐步向用户开放。

根据IT之家获取的信息,这项数字人技术结合了多模态理解与视频生成模型,能够实现口型与情绪动作的精准匹配。其所采用的DiT架构基于Transformer,具备处理时序信息和细节控制的独特优势。这使得系统能够准确分析面部特征,理解音频的语义,并据此推导出合适的面部表情与微动作,从而确保数字人在视频中始终维持角色的一致性。
在角色选择与语言支持方面,可灵AI的数字人功能表现尤为突出。它支持多种角色形象,包括真人、动画人物及动物,并且能够处理中文、英文、日文、韩文等多种语言,满足了用户的多元需求。在定价策略上,结合会员优惠,用户最低可享受0.12元每秒的使用费用。
现阶段,可灵AI的数字人功能正在公测中,用户可通过可灵AI官网进行体验。未来,随着技术的进一步发展及API的开放,该数字人有望与更多第三方平台和应用实现整合,构建更加完善的生态系统。
参考文章:AI写作的全景探索-从学术论文到创意漫画的应用与挑战
本文标题:快手推出可灵AI数字人:1080p高画质视频生成,时长最长可达1分钟!
网址:https://www.aidamoxing.cn/2025/11/04/61731.html
----------------------------------------------------------------------------------------------------------------------
本站所有文章由ai大模型网通过chatgpt写作修改后发布,并不代表本站及作者的观点;如果无意间侵犯了阁下的权益,请联系我们删除。
如需转载,请在文内以超链形式注明出处,在下将不胜感激!











