这家杭州科技公司创始人，为何成为总理的“座上宾”？

橙柿互动记者邵婷殷军领

2025-01-21 21:28:07

1月20日下午，中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会，听取对《政府工作报告（征求意见稿）》的意见建议。

在此次座谈会上，共有9人先后发言，就解决当前发展中的问题、做好今年政府工作提出了意见建议。

他们分别是——

北京大学经济学院院长张辉；

浙江大学党委书记任少波；

中国工商银行党委副书记、行长刘珺；

深度求索（DeepSeek）创始人梁文锋；

遨博（北京）智能科技股份有限公司董事长魏洪兴；

中国机械工业集团有限公司副总经理、总工程师陈学东；

国家图书馆古籍馆馆长陈红彦；

中国医学科学院北京协和医院副院长杜斌；

中国体操运动员、巴黎奥运会冠军获得者邹敬园。

其中，深度求索（DeepSeek）是来自杭州的一家大模型科技公司。这家公司是什么来头，创始人梁文锋为何能成为总理的“座上宾”？

来自东方的神秘力量

大模型界的“拼多多”

DeepSeek，全称“杭州深度求索人工智能基础技术研究有限公司”，成立于2023年7月，由知名量化资管巨头幻方量化创立。

在硅谷，DeepSeek很早就被称作“来自东方的神秘力量”，也是网上热议的“杭州六小龙”之一。

真正让DeepSeek火出圈的是2024年12月26日，这家公司宣布上线并同步开源的 DeepSeek-V3模型，并公布了长达53页的训练和技术细节。

它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元，而GPT-4o的约为1亿美元，使用25000个GPU芯片。双方的成本至少是10倍的差距。

在性能上，DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。

国外独立测评机构Artificial Analysis测试后，发出了“超越了迄今为止所有开源模型”的惊叹；Meta科学家田渊栋感慨：“这是非常伟大的工作。”

“性价比”是商业社会中的制胜法宝之一，DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”，引发字节、阿里、百度等大厂的大模型价格大战。

在外部看来，降价很像在抢用户，也有人说这家公司是行业的一条鲶鱼，公司创始人梁文锋表示，“我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼。”

“抢用户并不是我们的主要目的，我们降价一方面是因为在探索下一代模型的结构中，成本先降下来了；另一方面也觉得无论API，还是AI，都应该是普惠的、人人可以用得起的东西。”梁文锋说。

中国大模型将成为不容忽视的力量

与DeepSeek-V3低成本训练一样令人惊叹的是DeepSeek的员工规模。

在团队配置上， DeepSeek团队只有139名研发人员，相比OpenAI拥有1200名研究人员，团队规模是DeepSeek的近乎9倍之多。

其中，算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人。比如前段时间的热门话题“雷军千万年薪挖95后天才AI少女”，这位“95后AI天才少女”罗福莉，就是DeepSeek开源大模型DeepSeek-V2的关键开发者之一。

OpenAI前政策主管、Anthropic联合创始人Jack Clark曾这样评价DeepSeek：“雇佣了一批高深莫测的奇才”，还认为中国制造的大模型，“将和无人机、电动汽车一样，成为不容忽视的力量。”

梁文锋是谁？

说回DeepSeek创始人梁文锋，他出生于1985年，广东湛江人，此前他接受专访时自称，“我是80年代在广东一个五线城市长大的。我的父亲是小学老师……”

17岁时，梁文锋考入浙大，读的是电子工程系人工智能方向，毕业后在浙大攻读硕士研究生，论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。

2015年，30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司，立志成为世界顶级的量化对冲基金。2016年10月，幻方量化推出第一个AI模型，第一份由深度学习生成的交易仓位上线执行。到2017年底，几乎所有的量化策略都采用AI模型计算。

2023年5月，38岁的梁文锋宣布做通用人工智能（AGI）。7月，他正式创办杭州深度求索人工智能基础技术研究有限公司，就是DeepSeek公司，专注于AI大模型的研究和开发，公司设在杭州。

从公开的工作经历和职业生涯来看，梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验，创业范畴横跨金融和人工智能领域。

这家公司为何会受邀参加座谈会？

去年，12月18日至20日，李强总理在浙江调研。在杭州，李强来到城西科创大走廊未来科技城展馆和之江实验室调研。

他指出，创新是引领发展的第一动力。要主动拥抱科技变革浪潮，大力开展基础研究和共性关键技术研究，加强算力等新型基础设施布局建设，取得更多原创性引领性成果，为实现高水平科技自立自强贡献力量。

杭州未来科技城

1月20日，就在参加总理座谈会的当天，DeepSeek正式发布DeepSeek-R1模型。这款大模型在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

在座谈会上，李强总理提到，“要以科技创新推动新旧动能转换，集中力量突破关键核心技术和前沿技术，加快推进科技成果产业化，努力培育更多经济新增长点。”

DeepSeek只是杭州科技创新的一个代表，国产大模型公司在列总理座谈会，可见国家对科技的重视，也足见杭州在人工智能领域的强大实力。

之江实验室

过去30多年的IT浪潮，中国基本上没有参与到真正的技术创新，扮演的是追随者的角色。梁文锋曾在访谈中提到，“随着经济的发展，中国也应该逐步成为技术创新的主要贡献者，而不是一直依赖别人的成果。”

责任编辑：邵婷审核：陈奕殷军领