目前,虚拟人主要分为“服务型”和“身份型”。服务型虚拟人具有功能性,能替代真人服务,完成内容生产及一些简单工作,帮助企业降低运营成本,例如虚拟主播、虚拟客服、虚拟陪伴者、教育、文旅展示等。身份型虚拟人多以虚拟偶像呈现,或是用户在虚拟世界(如元宇宙)的分身,用于社交娱乐。例如,李南星、陈欣淇、葛米星等本地艺人2024年3月推出了自己的数码分身,能用于直播、宣传、视频拍摄等工作。
往生者借虚拟人“重生”争议
虚拟人普及化让林珊珊担心一些人可能会跟这些虚拟人建立起“拟社交关系”(parasocial relationship)。这种关系类似于现实社会中的人际关系,但具有虚拟性和单向性的特征,是用户单方面的情感投入和认知。
大量使用或影响实际互动能力
新加坡管理大学传播与科技学教授林珊珊认为,虚拟人技术能够突破地理和语言的障碍,使沟通更加便捷。然而,她也强调真人互动依然不可替代。“面对面的交流能够提升我们的跨文化素养、沟通能力及协作能力等。即使科技不断进步,我们仍然须要注重人性化的部分。”
虚拟人的制作过程非常简单,只要自己用手机录制5分钟视频,对着镜头讲话就行。视频送交给腾讯生成虚拟人后,秦铭汉就可随时登陆腾讯云使用。他选择了一个中级配套,价格介于1000至2000新元,能生成10个小时的虚拟人内容。据了解,如果要虚拟人更像真人并有互动能力,得多付几千元。
秦铭汉目前也是新加坡科技设计大学和新加坡管理大学商学院讲师,教导创业和智能产业等。他说:“新科大S.M.A.R.T企业大师课程的企业家今年4月组商务团到深圳参访交流,我们参观了华为、腾讯、阿里巴巴等中国各大科技公司。我在腾讯展厅接触到他们的数字人技术,觉得挺适合我使用。我因为教课,须录制一些课程视频,帮学生更好地学习。不过,痛点是我得打扮、看镜头、记讲稿,之后还要剪辑,对我来说比较困难。有了数字人就会方便很多。我不须做任何摄制准备,要数字人讲什么就直接打字输入,内容完美也不会出现口误。”
腾讯云智能副总经理李牧青认为,全球对AI生成的音频和视频技术有很强的需求,而亚太地区是一个人口年轻、移动优先的市场,有很大发展潜力。腾讯云计划加大虚拟人在东南亚的应用,帮助本区域企业利用AI技术打造智能业务,增强竞争力。腾讯云目前能利用默认的虚拟人形象,以AI合成播报型视频,口型与发音一致,表情及动作自然拟人。若需要的话,虚拟人还能与用户进行实时语音互动。
想象你拥有一个数码分身。它可以帮你出席各种工作会议,流利地讲各国语言,确保信息无误传达。这不是一个遥不可及的梦想,而是一个即将到来的现实。虚拟人(也称数字人,digital humans)已开始在多个领域出现,从娱乐、教育、客服到营销都可见其身影。
安波也是南大校长讲席教授。他说:“比如要数字人唱歌,它除了随着歌张开嘴巴以外,面部表情也须根据歌词改变,可以是欢乐或者伤心。这里面包含非常复杂的技术,需要用大量数据去训练数字人脸部肌肉与对应歌词的关系。而这只是一张脸而已,如果要生成数字人的身体,肢体语言和动作协调会是一个更大挑战。”
大量使用虚拟人也可能让人们对真人互动产生不切实际的期望。林珊珊说:“跟数字人交流非常方便和舒服,无论我说什么,它总是很有耐心,不会评判我。因此当我跟真人互动时,面对各种情绪和无法预料的情况时,我可能会无法应对。”
针对以虚拟人复活逝者的问题,李牧青说,AI领域仍在发展,市场份额竞争和商业模式实验不断。“腾讯云凭借多年的行业经验,采取审慎的方法,在产品开发过程中考虑可以利用的各种AI工具和能力。我们的数字人功能仅对已认证的企业客户开放。这些客户须要提供必要文件和资料进行身份验证,例如有效的个人身份证,以及基于该头像的人的现场视频录制。我们不允许任何未经授权数字人的创造行为。”
此外,秦铭汉认为能用虚拟人更好地跟外国人沟通和交流。“八月中旬我带了几名大学生到印度尼西亚了解当地的创新创业生态。每个人都会问我们为什么来?S.M.A.R.T企业家协会是什么样的组织?我不懂印尼话,双方沟通有些障碍。如果使用数字人,我能以印尼话生成一段背景介绍的视频,提前发给他们。我们一抵达就能直接交流,节省一些时间。”
林珊珊说:“例如用户可以深深被某个AI虚拟偶像或主播吸引,非常依赖与这个虚拟人的互动,连生活决策也向AI偶像求助。这是很不健康的,因为这背后并没有任何真实人际关系存在,只不过是一个AI算法在运作而已。”
有些人也担心虚拟人技术会有数据和隐私安全问题。李牧青回应,腾讯云对客户的业务数据给予最高的保密性:“客户对自己的数据拥有独家所有权和控制权。我们也拥有超过20项与公共云信息保护相关的国际认证。”
随着虚拟人技术的迅速发展,真假难分让“换脸”和诈骗行变得更加容易。安波认为政府的监管非常重要:“像韩国的深伪色情犯罪情况就很糟糕,所有人都难以幸免。”
汤晓鸥虚拟人的新闻引发了不少热议,有些人觉得这违背了伦理道德。据报道,商汤科技是获得汤晓鸥家人的授权后才制作虚拟人视频。
安波认为以AI虚拟人复活逝者,是好是坏得看背后目的是什么。“技术其实并不可怕,可怕的是这个技术到底怎么用。任何技术都有两面,例如火药既可以用于工程,同时也可以制造武器,AI数字人的技术也是如此。这事没有好坏,要看使用者的目的以及最后取得的效果。”
亚太地区发展潜力大
值得注意的是,腾讯旗下的微信视频号2024年6月发布通知,拟推出新规则限制虚拟主播带货,希望鼓励真人主播跟观众实时互动。
虚拟人已开始出现在多个领域,从娱乐、教育、客服到营销。虚拟人技术能够突破地理和语言障碍,提供许多便捷,但若使用不当,其弊端也彰显,包括误导、诈骗,以及对实际的社交与沟通带来挑战,使用者的道德更是备受考验。利用虚拟人技术让亡者“重生”是当前最具争议的现象。科技领域专人怎么看?
虚拟人崛起带来一个很独特的应用场景——让人“死而复生”,重现逝者的形象、声音和行为。中国AI技术公司商汤科技就在2024年3月召开的年会上播出一段视频,让2023年12月逝世的创始人汤晓鸥以虚拟人形式发表演讲。汤晓鸥虚拟人的声音、表情、动作都非常自然,中场还拿起水杯喝了一口水。有些员工以为这是汤晓鸥过世前录制的视频,一些人还当场感动落泪。
林珊珊说:“每个人处理悲伤的方式各不相同。有些人非常想念已故亲人,与已故亲人的数字人对话,可让他们获得心灵安慰,帮助他们度过悲伤。另一方面,也有人认为这反而有害,AI生成的虚拟人并不是真的,会让人们一直缅怀过去,阻碍他们接受失去亲人的事实。”
目前,虚拟人技术仍不完美,虽然在外观和行为上已经高度仿真,但依然无法完全像真人那样灵活自然。南洋理工大学计算机与数据科学学院人工智能系主任安波说,要让虚拟人看起来与真人无异,需要极为复杂的技术。
秦铭汉对虚拟人的未来充满期待,希望虚拟人的互动性能增强,可自然地回答各种问题,实现流畅的人机交流。同时,他希望形成规模效益,从而降低这项技术的门槛。
林珊珊认为企业使用AI虚拟人时,必须对消费者坦诚告知。“如果一家企业提供线上心理咨询服务,那么绝不能将AI虚拟咨询师冒充为真人,这种行为极具误导性。如果要使用AI虚拟人物进行心理咨询,必须明确告知,同时还要警告数字人可能会提供不准确信息。”
本地S.M.A.R.T企业家协会联合创办人兼秘书长秦铭汉最近利用腾讯云技术,创造出跟自己一模一样的2D虚拟人。这是腾讯云首次在中国以外为一名新加坡人打造出虚拟人。
尽管技术挑战很大,但安波认为业界可能在一两年内克服这些障碍,“现在已经有了大语言模型,下一个目标是完善视觉语言模型技术。”
延伸阅读
秦铭汉的虚拟人外观几乎与真人无异,但它只能正面对视,无法自由转身或转头,动作相对有限,主要为讲课用途。秦铭汉说他的虚拟人可以辅助教学,让学生们在课堂以外的时间自由复习,巩固学习概念。
虚拟人制作过程简单
中国的电商直播、短视频等商业化发展迅猛,虚拟人应用比其他国家更早爆发。根据艾媒咨询的调查,预计到了2025年,虚拟人的核心市场规模将达到480亿人民币(约89亿新元)。而据Data Bridge调查公司报告,全球虚拟人市场预计于2031年达到4307亿美元(5857亿新元)。
监管与保护隐私的重要性
业界尚未对虚拟人有明确定义。IDC调查公司将之定义为,采用人工智能技术驱动生成的数码虚拟人物,具备人的外形,感知互动能力及表达能力。
如果虚拟人那么厉害,难道他不担心被取代?秦铭汉笑答:“我相信无论数字人技术如何先进、互动性如何增强,人们的交流最终还是会回到面对面的真实场景。这是人类本性,人与人之间的情感连接是AI难以真正复制的。”
李牧青说:“腾讯云的数字人(该公司称智能数智人)支持多种小语种,业务人员的数智分身能说多种语言,支持商务交流、社交媒体、演讲、在线研讨会等场景,节省大量拍摄和剪辑视频的时间和精力,帮助打造品牌差异化,让产品更具吸引力。我们最初的目标行业包括食品和饮料、零售、教育和旅游。”