入驻此处(首页+内页),送永久快审,百度隔日收录!
立即入驻

今年的天才少女人才辈出

行业新闻1周前发布 XiaoWen
368 00

Deepseek:在AI领域掀起波澜的开源模型

DeepSeekV3的亮相与争议

12月26日,Deepseek宣布其全新系列模型DeepSeek-V3的首个版本正式上线并同步开源。官方称,DeepSeek-V3在多项评测中超越了Qwen2.5-72B、Llama-3.1-405B等开源模型,并与世界顶尖的闭源模型GPT-4o、Claude-3.5-Sonnet不相上下。Deepseek还披露了v3模型的训练成本仅为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。

DeepSeek-V3的亮相引发了轰动,但同时也给自己挖了一个坑。有人发现,当用英文提问”whatmodelareyou”时,DeepSeek-V3给出的答案是ChatGPT。而当用中文或在”whatmodelareyou”后面加问号时,它却能正确回答。对此,Deepseek官方尚未做出回应。

有分析认为开源模型中,推理成本被降到每百万token仅1块钱,约等于Llama370B的七分之一,GPT-4Turbo的七十分之一。

这得益于DeepSeek提出的崭新的MLA架构,该架构将显存占用降到了过去最常用的MHA架构的5%-13%。DeepSeek独创的DeepSpeed优化器也大幅提升了模型训练的速度和效率。

Deepseek人才引发关注

在DeepSeek取得技术突破的同时,其人才也引发了关注。12月27日,有媒体报道了95后天才少女罗福莉将加入小米的消息。罗福莉来自Deepseek,这使得Deepseek再次成为人们关注的焦点。

雷军以千万年薪挖角罗福莉的报道也刷屏了社交媒体。事实上,罗福莉加入小米的消息早在12月20日就已经曝光,但当时并未引起广泛关注。而最近几天,相关新闻突然刷屏,原因不明。

© 版权声明

相关文章

暂无评论

none
暂无评论...