从数据中学习进而生成全新内容

上周二(2月7日),微软宣布推出新的Bing搜索引擎和Edge浏览器,这些应用将由OpenAI的生成式AI技术支持。微软目前在互联网搜索市场的份额只有约10%,推出新应用极可能撼动谷歌的霸主地位,并让微软额外获得至少约20亿美元(约26亿新元)的搜索广告收入。除了搜索功能之外,微软也计划将AI技术添加到旗下的Office 365和Teams团队协作软件等。

ChatGPT最近在全球掀起“生成式人工智能”热潮,科技公司纷纷砸大钱争当领头羊。生成式AI能理解人类的自然语言,且单凭文字就可创作出各类内容,善用,它可以成为人类的好帮手。但受访科技专才坦承,目前还很难预测这项技术的未来发展,应抱持谨慎乐观的态度。

温友明说,ChatGPT是微软Azure OpenAI服务的一部分,由于功能强大又灵活,可运用在多种情况和各产业中。“例如在客户服务方面,AI可以综合及分类客户询问,搜索提取主要情绪或词语,并生成合适的答案。这能更快地为客户提供帮助,提升他们的客服体验。”

ChatGPT是一种“生成式人工智能”(generative AI),这项技术大火以后,全球各大科技公司都争相加入这场AI大战,微软、谷歌、百度等最近纷纷宣布会利用生成式AI推出新产品和服务。

拥有美国斯坦福大学电脑科学系(人工智能)硕士学位的梁凯源说:“之前的AI多属于判别模型(discriminative model),例如可以判定图中是否有猫,这是不是垃圾电邮等。生成式AI不只能判别,还能创造,例如我可以叫生成式AI帮我写一篇感伤的文章。”

这场科技变革自然少不了脸书母公司Meta。首席执行官扎克伯格(Mark Zuckerberg)在最新季度业绩线上会议中就说:“生成式AI是一个非常精彩的领域,有许多不同应用。Meta的其中一个目标是,利用我们现有的研究基础,成为生成式AI的领导者。”扎克伯格并没有透露任何详情,只说今年内会推出新产品。在中国,百度亦有意推出同类AI产品“文心一言”;阿里巴巴也证实正在打造阿里版ChatGPT,目前处于内部测试阶段。中美AI分庭抗礼,未来科技竞赛势必更加激烈。

相信许多人应该已经听过ChatGPT的大名。由微软投资的美国科技公司OpenAI研发的人工智能(AI)聊天机器人ChatGPT近期在全球掀起热潮。只要输入问题,ChatGPT会立即以自然流畅和简洁的话语回答,而且答案看似头头是道,迅速成为科技界当红炸子鸡。

南大副教授李搏扬:生成式AI是AI技术的大跃进。(龙国雄摄)
拥有美国斯坦福大学电脑科学系硕士学位的梁凯源说,生成式AI不只能判别,还能创造。(档案照)

南洋理工大学计算机科学与工程学院副教授李搏扬接受《联合早报》专访时说:“这是AI技术的大跃进。生成式AI比上一代AI最大的改进在于,它可以理解人类的自然语言,你用文字给出指示,AI可以照做,帮人类完成任务。此外它能创造出各种风格的文章,且文字跟真人写的很像。”

2022年9月Meta推出了AI影片生成程序“Make-A-Video”,使用者只须输入一段文字或图片就能生成短片。Meta发布了几段视频示例,例如一只穿着红色斗篷的狗在天空飞翔,一只在作画的泰迪熊等。

微软早在2019年便对OpenAI投资了10亿美元(约13亿新元)。继ChatGPT爆红后,美国媒体上个月报道微软计划再对OpenAI注入100亿美元(约130亿新元)。对此,微软拒绝置评,只表示对OpenAI是“多年、多亿元”的投资,展现其战略雄心。

ChatGPT会加快编码过程,我不用花时间做简单编码,可以腾出时间做更复杂的程序工作。编码最重要的是整个系统设计,这部分无法由AI取代。”

微软新加坡人工智能与数据专家温友明认为,生成式AI将帮助人类轻易理解和消化大量数据。(龙国雄摄)

什么是ChatGPT和生成式AI?

Make-A-Video可以生成出作画的泰迪熊视频。(Meta提供截图)

谷歌去年11月也正式发布人工智能模型“Imagen”,同样是通过文字描述生成图像,似乎是想跟DALL-E 2较劲。此外,谷歌2023年1月发布关于“MusicLM”的研究报告,该AI模型可以从文本描述甚至哼唱或吹口哨,生成各种高保真音乐。不过谷歌并没透露几时会向大众推出Imagen和MusicLM服务。

面对微软和OpenAI来势汹汹的挑战,谷歌首席执行官皮查伊(Sundar Pichai)上周宣布,将推出AI聊天机器人“Bard”,以谷歌大型语言模型作为基础,跟ChatGPT一较高下。Bard目前只开放给特定人员测试,预计几周之后会开放给公众使用。此外皮查伊也透露,谷歌正在努力将最新的人工智能引入各项产品,其搜索引擎将率先加入生成式AI功能。

戴尔(Dell)新加坡副总裁兼总经理沈俊桄受访时说,虽然生成式AI提供了无限应用可能,但跟所有新科技一样,用户使用它时应该小心谨慎。“这项新技术面对的一些挑战包括答案可信度低,以及无法回答某些特殊领域的问题等。AI科技公司应该向用户提供AI信息的来源,这将有助于减少伤害,增加用户对生成式AI的信任。”沈俊桄也警告,人们可能会滥用生成式AI,导致抄袭和假消息等问题出现,“如果人类太依赖ChatGPT,我们甚至会丧失思考和书写的动力。”

戴尔科技集团新加坡副总裁兼总经理沈俊桄:用户使用生成式AI应该小心谨慎。(档案照)

对于生成式AI,人类到底应该高兴还是担忧?李搏扬说目前还很难预测这项技术的未来发展:“我认为应该抱着谨慎乐观态度。我们应该先理解和分析这项新科技,然后仔细思考它的影响。我们目前还没想到要如何取得最大利益并把伤害降到最低。每项科技变革都会有人获益,有人损失,但我觉得生成式AI是人类另一个必须适应的改变。”

GPT全称是“generative pre-trained transformer”,中文翻译成“生成式预训练转换器”。ChatGPT是一个基于GPT-3大型语言模型(Large Language Model,简称LLM)的对话机器人服务,可理解包含中文在内的多国语言。它的训练资料包括大量的对话数据,因此它能够学会在对话中如何自然回答,模拟人类的语言行为,输出的回答看起来类似人类语言,不像传统机器学习模型那样生硬。ChatGPT还具有强化学习功能,透过人类回馈增强机器学习效果,让交互变得越来越自然。

ChatGPT只是生成式AI的其中一个应用。所谓生成式AI就是通过各种机器学习方法从数据中学习,进而生成全新内容(文字、图片、视频等)的AI。例如2022年4月,OpenAI就先推出名为DALL-E 2的生成式AI,用户只要输入文字形容自己想要的内容和风格,系统就能模拟大师画风,生成各种精美图像,让不少人惊叹。

梁凯源认为生成式AI虽然非常聪明,但最终仍无法取代人类创意。“比如我可以指示AI写一篇关于俄罗斯的文章,它会搜索和总结互联网上所有相关信息,生成一篇文章,但这文章缺乏人类的见解和深度。”李搏扬同意梁凯源的看法,认为ChatGPT生成的文章表面很漂亮,但内容或许有点空洞。

生成式AI之战

微软新加坡人工智能与数据专家温友明认为,生成式AI是一个重大突破,“我们通过微软Azure的AI超级电脑及世界最先进的语言模型来训练生成式AI。这项技术会大大提升生产力,产生加倍效果,解决我们之前认为无法解决的一些世界难题。现在资讯泛滥,人类很难处理,有了生成式AI,人类能轻易处理大量数据,消化和理解它们。”

或取代入门级白领工作

此外,黑莓(BlackBerry)最近跟1500名北美、英国和澳大利亚科技人士做调查后发现,74%的受访者担心ChatGPT或对网络安全构成威胁。一半(51%)的人预测,在未来一年内,该AI技术会被用来实施网络攻击。

具潜在威胁 须谨慎使用

ChatGPT 2022年11月30日以测试版上线,其“生成”功能多元化,用户可以用它写论文、写营销文案、编代码、创作诗歌等。在短短两个月内,ChatGPT月活跃用户数量已超过1亿人,是历来增长最快的消费者应用程序。

AI虽然功能强大,但也会出错。例如为推广Bard,谷歌最近播出一支视频广告,称Bard能简化复杂问题。视频中有个提问:“关于詹姆斯·韦伯太空望远镜(JWST),我可以告诉我9岁的孩子它有哪些新发现?”Bard其中一个答案是:“詹姆斯·韦布空间望远镜拍摄了太阳系以外行星的第一批照片。”其实这不符合事实,第一张系外行星照片是由欧洲南方天文台的VLT望远镜拍摄的。这错误答案让投资者认为谷歌“技不如人”,一度导致谷歌股价大跌9%。

谷歌Imagen通过文字描述可生成熊猫骑车的图像。(谷歌提供)

李搏扬倒认为生成式AI对本地人的最大威胁是,它或许可以取代许多入门级白领工作。“蓝领工作如清洁员工等,通常包含复杂的机械性动作,目前的机器人还无法取代。然而,入门级的白领工作主要是用电脑处理数据及文书任务、搜集资料等,这些工作是最容易被AI取代的。”一些受AI威胁的白领工作,包括律师助理(paralegal)、初级程序员、初级会计师等。

另一个例子是ChatGPT能协助编码,温友明说:“AI可以帮助程序员分析和简化复杂的编码任务,在几分钟内编码。专业AI开发者可用生成式AI支持的软件减少编码时间。就算没有科技背景的人,ChatGPT也能协助他们构思和创造原型,解决他们的难题。”ChatGPT那么厉害,是否意味着大家以后都无需学编码,编码员将丢饭碗?梁凯源是火箭学院(Rocket Academy)创办人,该学校专提供编码课程。他笑答:“就好像计算机发明之后,我们就不用纸和笔来算数。