DeepSeek彻底火“出圈”后,关于梁文峰、幻方量化的赞誉也充满了互联网。科技的突破固然令人振奋,赞誉之余,回顾往年的采访,我们才发现:这样的成功不是偶然,而是正确的道路、持续的积累、滴水石穿而成的。
引用采访见于:疯狂的幻方:一家隐形AI巨头的大模型之路。
开源与闭源
许多人不理解,对于DeepSeek-V3基础模型、R1推理模型这样性能优异、成本优势巨大的模型,为什么不仿照OpenAI、Anthropic等公司的闭源商业模式,低成本、大量级“捞钱”,而是选择开源,让所有公司团队都能本地部署它们?梁文锋是这样回答的:
在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,这就是我们的护城河。
相比于开源带来的盈利,他们更追求在开发开源技术的过程中沉淀的经验,用团队实力构建真正的“护城河”。支撑这样理念的实现,需要团队的共识,其基础正是很多程序员的远大理想:
这个世界存在很多无法用逻辑解释的事,就像很多程序员,也是开源社区的疯狂贡献者一天很累了,还要去贡献代码。类似你徒步50公里,整个身体是瘫掉的,但精神很满足。
精神满足、业界认可,做开源贡献者,这是多少程序员、技术开发者的浪漫理想。
创新人才从何而来
为了建立这样一支有共同理想、目标一致的团队,他们采用非常理想化的选人招聘标准:
我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。
常有言:“程序员职业寿命短,35岁以后不转管理岗就面临淘汰”。这可能确实是大多数人的情况:
不是所有人都能疯狂一辈子,但大部分人,在他年轻的那些年,可以完全没有功利目的投入地去做一件事,
创新从何而来
从创新人才的招聘,到创新成果的产出,其中的创新创作过程,更需要依赖合适的管理机制。关于如何管理创新人才、促进成果产出,他们的经验是:
我们的核心技术岗位,基本以应届和毕业一两年的人为主。做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。
正所谓:经验既能作为创新的基础,又能阻碍创新。其两面性,注定了“年轻血液”之于创新团队的重要性。实事求是,反对教条主义,确实是至理。
创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。我们交给员工重要的事,并且不干预他,让他自己想办法,自己发挥。
Road2AGI
AGI(通用人工智能)一直是AI发展的一个重要目标,大数据催生了当今时代的AI系统,并正在经历由“离”(数理模型)向“心”(价值函数)的过度,向真正的通用智能体迈进[2]。没有人知道那个“奇点”会在什么时候出现,会在哪一领域出现,但不可否认的是大语言模型是目前的一条道路:
我们理解人类智能的本质就是语言,人的思维就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)
AGI可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向:一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。
他们的推断,会成为预言吗?这让我不禁为之神往,期待有生之年见证这一天的出现。而在这一天出现之前,我们仍将作为时代浪潮中的一滴滴水,作为产业长下游链条中微不足道的一分子:
未来会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。
从2022年GPT模型爆发,到2025年低成本、高性能的应用级模型Deepseek出世,科技发展的规律昭示我们,下一步该是大语言模型的应用集中爆发了。或者,更激进一点地说,我们正在经历的正是大语言模型+AI应用的黄金年代。
Reference:
[1] 疯狂的幻方:一家隐形AI巨头的大模型之路
[2] 通用人工智能-百度百科