
意外爆火后,DeepSeek 正在努力接住这“泼天的富贵”。
整个春节假期,DeepSeek 成为最火的一款 AI 应用。这也让其数度宕机,联网搜索功能一度无法使用。为应对急速扩张的业务需要,招聘网站上,DeepSeek 放出了一系列职位,豪掷百万年薪聘请 AI 人才。
上线 20 天日活突破 2000 万百万年薪“招兵买马”
根据国内 AI 产品榜统计,DeepSeek 应用上线 20 天,日活就突破了 2000 万。与此同时,DeepSeek 应用(不包含网站数据)上线 5 天日活就已超过 ChatGPT 上线同期日活,成为全球增速最快的 AI 应用。日活数量的快速增长,从侧面印证了 DeepSeek 对C端用户广泛的吸引力。
然而,意外爆火的 DeepSeek 在面对源源不断的新用户方面,也显得有些力不从心。春节期间,据网友多次反馈,DeepSeek 应用屡屡陷入服务崩溃的状态,联网搜索功能曾在一段时间里无法使用。有业内人士分析称,既要应对近期涌入的大批用户,又要继续提升模型性能,DeepSeek 亟需扩充算力基础设施,以满足更多用户的访问需求。
除了算力基础设施,DeepSeek 亟需扩充的还有人才队伍。据公开资料,DeepSeek 员工数量大约为 150 人左右,与 OpenAI 的 1700 名员工相比,规模较小。记者在某招聘平台看到,DeepSeek 目前已放出了 37 个招聘职位,招聘的岗位涵盖客户端研发工程师、深度学习研发工程师、全栈开发工程师、自然语言处理算法、深度学习研究员等多种不同的岗位。
其中,深度学习研究员岗位的薪资水平为 50—80k*14 薪,工作地点为北京,招聘要求是在校或者应届的硕士生。这意味着,若按照最高月薪 8 万元计算,应届生入职 DeepSeek,年薪就可达到 112 万元。另外,有业内人士告诉证券时报记者,顶尖高校的在校生如果通过校招拿到了 DeepSeek 的 Offer,在校实习期间就可以享受到与正式入职时相同的工资。
根据岗位描述,该职位的工作内容包括设计开拓性的新的深度神经网络;构建科学严谨的算法评测体系;紧跟领域前沿,推动基础研究。要求则包括需要精通机器学习或深度学习,具备创新研究能力,编程能力出色并且有丰富的研究成果,在国际顶会或期刊发表相关论文。
除了正式员工,DeepSeek 还招聘 AGI 大模型-数据百晓生实习生、深度学习-AGI 实习生等实习岗位,实习工资为每天 500 元左右,中餐由公司提供,还可以享受 80 元的晚饭餐补。这意味着,一名在校本科生在 DeepSeek 实习,若按照一个月工作 20 天计算,月薪也能达到万元水平。
值得注意的是,DeepSeek 不仅在国内爆火,在海外多个国家也很受欢迎。据媒体报道,自今年初发布以来,DeepSeek 迅速攀升至 140 个国家的苹果 App Store 下载排行榜首位,印度成为了这款应用新用户增长的最大“引擎”,其下载量占据了所有平台下载总量的 15.6%。
或是因为在海外市场持续受追捧,DeepSeek 也在加大国际业务方面的布局。记者注意到,在 AGI 大模型-数据百晓生实习生岗位要求一栏,明确标明了“小语种专业优先考虑”以及“涉猎广泛、博闻强识,对各行各业的知识都拥有强烈的兴趣”。
此前,DeepSeek 创始人梁文锋在接受媒体采访时曾表示,“我们并没有什么高深莫测的奇才,都是一些 Top 高校的应届毕业生,没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。”纵观 DeepSeek 放出的岗位,可以发现,其招聘偏好依然为在校生或者应届生,并不要求应聘者有相关的工作经验,核心的要求是具备创新意识和较好的编程能力或学术研究成果。
DeepSeek“朋友圈”持续扩大
在应用日活飙涨的同时,国内外主要的云厂商和芯片厂商近日接连宣布接入 DeepSeek 模型。
海外市场方面,1 月 31 日,微软的 Azure 云服务宣布 DeepSeek-R1 正式上线微软的 Azure AI Foundry 以及 GitHub。同日,全球第一大云巨头亚马逊 AWS 宣布 DeepSeek-R1 模型全面上线,英伟达也宣布 NVIDIA NIM 已经可以使用 DeepSeek-R1 模型。
国内方面,2 月 1 日,华为云宣布,经过华为云和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的 DeepSeek-R1/V3 推理服务。华为云还提到,得益于自研推理加速引擎加持,双方支持部署的 DeepSeek 模型可以获得持平全球高端 GPU 部署模型的效果。
紧接着,腾讯云 2 月 2 日也宣布,DeepSeek-R1 大模型可一键部署至腾讯云 HAI 上,开发者仅需 3 分钟就能接入调用。腾讯云表示,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤,只需两步即可调用 DeepSeek-R1 模型。2 月 3 日,阿里云、百度智能云发文宣布,正式接入 DeepSeek-V3、DeepSeek-R1 模型。至此,国内四大云巨头都已正式接入了 DeepSeek。
业内人士分析称,在大模型领域,OpenAI、Anthropic 等市场上领先的玩家选择了闭源的封闭路线,而 DeepSeek 选择了开源,任何人都可以部署、修改、优化其模型。“这就像是传统软件时代的 Windows 和 Linux 之争”,DeepSeek 代表的不仅是一个模型,也是一种新的行业范式与游戏规则。当云厂商们纷纷选择接入 DeepSeek,将有越来越多的企业选择 DeepSeek 这样的开源方案,从而形成 DeepSeek“生态圈”。
中航证券研报表示,DeepSeek 在基础模型训练和推理模型训练均有创新,有效克服了推高模型成本的 FP8 训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本。DeepSeek 的研究还表明,较大的基础模型发现的推理模式对于提高较小模型的推理能力至关重要。在大模型蒸馏技术的加持下,端侧小模型的普惠化指日可待。
同时,研报还指出,美国科技巨头英伟达 NIM,微软 Azure,亚马逊 AWS 等智能云平台已上线部署支持用户访问 DeepSeek-R1 模型。DeepSeek 以创新的技术路线吸引了全球科技巨头,说明国产科技在开放创新的开源环境里具备强大的竞争力,有望涌现出更多的普适技术,我国本土科技企业的价值理应被重估。
责编:万健祎
校对:李凌锋