新的语言、使用规则健全而且科学的语言,可以为我们打开一扇全新的思维方式之门。对语言的不恰当限制,就是对思维的不恰当限制。限制来源于恐惧,对语言的限制,一定须要基于普遍性原则的最小集合,否则就可能成为压迫的工具。

我们知道,ChatGPT和DeepSeek这类GAI工具,都属于所谓大语言模型(LLM),基本原理是对配置多层神经元的AI神经网络进行“训练”,不断调节每个神经元的开关参数配置,即大模型参数。DeepSeek-V3的模型参数量达到6710亿个。如同人类社会中的意识形态,这些参数会被固化在神经网络中,用于推理回答新的问题。为了训练这些参数,技术人员须要用各种渠道(人工或者自动化),为LLM提供大量文本语言信息数据集,反复刷新神经元参数,直至收敛到一个“误差”较小的最优状态。这个误差又是如何确定的?

第二点,在商业上对中国国内厂商是重大利好,这也反映在春节后A股市场表现上:算力相关企业板块股价普遍大涨。但是有一点不能不提,DeepSeek目前的地位,如同2010年谷歌退出中国市场后的百度。当年谷歌退出中国这个庞大市场,是因为在搜索结果的“过滤审查”上,不愿意与中国政府妥协。今天DeepSeek的诞生,除了使用费用之外,很大程度也是因为ChatGPT不能在中国地区直接使用,基于类似的问题:敏感词过滤。

哲学家维特根斯坦说过:语言的边界就是我(思维)的世界。当代语言学家、哲学家乔姆斯基也把语言的主要功能,定义为人类思维的工具,而非交流方式。这些20、21世纪最伟大的哲学家、语言学家告诉我们:语言对于思维的重要性,远远超过我们大部分人的认知。新的语言、使用规则健全而且科学的语言,可以为我们打开一扇全新的思维方式之门。对语言的不恰当限制,就是对思维的不恰当限制。限制来源于恐惧,这也说明“没有危险的思想,思考本身就是危险的”(哲学家汉娜·阿伦特语录)。对语言的限制,一定须要基于普遍性原则的最小集合,否则就可能成为压迫的工具。

既然谈“误差”,那一定就有标准,否则无法衡量大小。DeepSeek涉及的语言标准,如同上文提到的那些平台,是受到政府限制的。如果观察一下ChatGPT,它的语言限制是基于某些普遍性原则,如侮辱性、歧视性、不道德词汇;DeepSeek的限制则完全不同,是某些特定的政治性词汇。可想而知,这两个GAI问答平台,对于某些具体的提问会给出截然不同的答案,就像我们在人类现实世界中看到不同意识形态之间的冲突一样。假如GAI真的有“自我意识”,也许ChatGPT和DeepSeek已经在我们看不见的互联网上争吵起来了。因为对误差的定义理解不同,导致冲突。

DeepSeek限制的是政治性词汇

中国的敏感词是有政府标准的,也有平台是为了避免惹麻烦而变本加厉审查。早在2013年10月24日,观察者网(笔者认为这是中国左派极端主义大本营)上,转载了一篇《美国政治学评论》的文章《哈佛报告:中国网络审查制度如何允许批评政府却禁止群体煽动》,其中提到“中国政府有选择地过滤中国网民言论,从其规模和复杂程度来说,这一工程史无前例”“约2万至5万网警和网管办(员工)、约25万至30万‘五毛党’都参与了这项艰巨工程”。时至今日,可以想象这项工程与12年前相比,可能更复杂和高效。这是当今中国普通百姓在使用语言文字时所须要面对的“长城”。

第一点毋庸置疑,如果DeepSeek所宣称的事实一一得到验证,性能可以随算力线性升级(如OpenAI总裁奥尔特曼所承诺的ChatGPT性能增长曲线),这就是GAI技术和应用上的一次重大进步。

(作者是北京金融数据业者)

“敏感词”在世界各国都有。比如德国,纳粹相关的算敏感词;美国白人不能说“N-word”(但是非裔可以说)、不能说“反犹”(anti-semitism)。在中国,类似的敏感词范围远远扩大到某些客观性话题。比如提问关于某些政治人物的名字、某些历史内容等等,DeepSeek会给出如下提示:“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”中国互联网上这个现象,笔者在豆瓣等社交平台上都看过,甚至在卖书平台当当网上,也经常看到在一些书评和内容介绍里,突然有几个字被“*”替换掉,联系上下文,十有八九是什么敏感词。

另外,我们不能忽视,目前所有这些技术,都局限在对语言文字的理解,而没有整合对图像的理解。这是一些顶尖AI科学家,如Meta公司首席科学家杨立昆(Yann LeCun)、斯坦福大学教授、World Labs联合创始人李飞飞等人正在开拓的领域:世界模型(World Models)。中国科研人员在DeepSeek初露锋芒后,不应该忽视这些最前沿的科学思想。不能等别人做完后,亦步亦趋的甘当一个追随者,就像DeepSeek追随ChatGPT一样。

总之,在很多客观性应用场景,如编写计算机语言程序代码、整理文档格式、提取文档概要,DeepSeek在降低费用和算力消耗上,是个巨大的进步,使得GAI工具在中国得到大范围推广。但是,在GAI技术所追求、承诺的,对人类语言甚至智能的掌握,以及从零到一的技术原创性和可扩展性上,DeepSeek还是与ChatGPT(OpenAI)、Gemini(谷歌)甚至Qwen(阿里巴巴)都有很大差距,主要原因之一是它所使用的训练数据集(DeepSeek未公开部分之一)所受的非普遍性原则的限制。从技术角度看,没有训练数据集,第三方就无法重现和验证DeepSeek在商业宣传和论文中公布的结果。

近期深度求索(DeepSeek)的巨大商业成功,笔者看来有两个原因:其一是它主打的小算力、低成本噱头(相对于ChatGPT这类已成功的生成式人工智能(GAI)平台);其二是它的中国血统。