新印合作的五家机构在文告中说,虽然大语言模型领域已出现OpenAI的ChatGPT和谷歌的Bard等人工智能工具,但大部分的研究以英语为主。“这导致其他语言市场方面出现缺漏,也把科技优势集中以英语为沟通语言的国家。”
新加坡全国人工智能核心是由新加坡国立研究基金会设立的全国人工智能计划,它聚集设于新加坡的研究机构,提升新加坡在人工智能领域的知识,推动研发能力。
文告指出,英文在网络内容中所占份额达58.8%,相比下,印尼文只占0.6%。因此,各方认为应展开更广泛的研发,“以顾及印尼文的微妙之处和需求”。
(雅加达综合讯)印度尼西亚和新加坡的人工智能机构将联合研发为印尼文量身定制的大语言模型,这款类似ChatGPT的人工智能工具更贴近印尼文,减少语境偏差的情况。
新加坡全国人工智能核心人工智能产品高级总监张永习说:“SEA-LION大语言模型有巨大潜能,能推动为印尼带来巨大利益的产品和方案。”
延伸阅读
《雅加达邮报》星期五(12月1日)报道,印尼通信与资讯科技部副部长内扎尔出席在雅加达举行的签署合作意向书仪式上致辞时说:“这是创新的一步,有助设立语言更道地、与印尼文更贴近的基础模型,从而减少人工智能中的偏差。”
新加坡全国人工智能核心(AI Singapore)星期四(11月30日)在雅加达与四家印尼机构签署合作意向书,共同研发可供众多相关方使用的印尼文开源大语言模型。
团队建立了以东南亚语言为基础的“SEA-LION”大语言模型,而Glair.ai和Datasaur.ai将在它的基础上进行调整,使它符合印尼语境。
GDP Venture代表也说,新印机构的合作将减少营运成本,提高收入和生产力。虽然这款模型的功能无法与ChatGPT相提并论,但研究团队的目标是创造更小规模、更廉宜及能设在本区域的模型。
四家印尼机构分别是印尼国家研究创新署(BRIN)、人工智能研究与创新合作组织(KORIKA),以及风险投资企业GDP Venture旗下的人工智能工具研发公司Glair.ai和Datasaur.ai。