科技流网
您的位置:科技流网 > 聚焦

国产大模型DeepSeek震惊世界:团队没有“海归”,训练成本不到GPT

阅读量:5957   添加时间:2025-01-27 17:31   内容来源:证券之星   

国产大模型DeepSeek超越ChatGPT,登顶苹果中国和美国应用商店免费APP下载排行榜,成为了全球科技圈的热议话题。

DeepSeek登顶苹果美国区免费APP下载排行榜

1月27日,苹果App Store中国区免费榜显示,DeepSeek站上首位。同时,DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位,超越ChatGPT及Meta公司旗下的社交媒体平台Threads,以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。

DeepSeek爆火后曾出现两次宕机。

1月26日,DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。

今日又有消息称DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。

和国内AI公司背靠互联网大厂不同,DeepSeek由量化对冲基金幻方量化运营。2016年,幻方量化推出首个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。2023年,幻方量化宣布成立创新性大模型公司DeepSeek。

2024年12月,DeepSeek-V3首个版本上线,并同步开源,训练成本仅为557.6万美元,整个训练只需要280万个GPU小时。

1月20日,DeepSeek又正式开源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。

从硅谷到华尔街,DeepSeek掀起涟漪

DeepSeek的影响迅速蔓延至大洋彼岸的硅谷。据澎湃新闻援引Information网站报道,脸书母公司Meta成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。

DeepSeek之所以引发科技圈关注最主要的原因在于其以极小的成本训练出能和OpenAI的ChatGPT 一较高下的人工智能大模型。

据每日经济新闻报道,DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一。

受此消息影响,华尔街也作出相应反应。

据21世纪经济报道,美股大VTHE SHORT BEAR在社交媒体上表示,DeepSeek创造了一个AI巨头们的痛苦时刻,而投资者必须对此敲响警钟。

如果击败OpenAI所需要的金额是5500万美元,那么这个行业的商业化会比很多人预想的要快很多。

1月25日,AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。这对于在AI竞赛时代一直颇为风光的英伟达略显尴尬。

据财联社报道,本周一,在亚洲盘交易时段,美国股指期货大跌,而这背后的主要原因,可能就是华尔街人士们担心DeepSeek的AI模型可能会颠覆美国科技界。

与此同时,在日本东京股市,英伟达的主要供应商Advantest Corp.的股价一度暴跌了8.6%。

本土阵容打造国产大模型黑马,实习生日薪最高上千元

1月26日,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

而这一科技成果背后是一个完全本土化的阵容,据大象新闻报道,DeepSeek团队不到 140 人,但 人才密度 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有海归,完全本土人才。

我们的核心技术岗位主要由今年或过去一两年毕业的人员担任,DeepSeek创始人梁文峰在2023年接受媒体采访时表示。

此前,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉就曾被雷军以千万年薪招揽。

DeepSeek爆火后,媒体也发现DeepSeek正在招聘。招聘网站显示,DeepSeek的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师,薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

从OpenAi横空出世,到DeepSeek以黑马之姿震惊世界,AI时代一日一变,一切皆有可能。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...