入驻此处(首页+内页),送永久快审,百度隔日收录!
立即入驻

年度天才少女井喷 史上罕见的才女大爆发

行业新闻1周前发布 XiaoWen
448 00

DeepSeekV3横空出世

12月26日,Deepseek发布了全新系列模型DeepSeek-V3的首个版本,并同步开源。官方宣称,DeepSeek-V3在多项评测中超越了其他开源模型,包括Qwen2.5-72B和Llama-3.1-405B,并与世界顶尖闭源模型GPT-4o和Claude-3.5-Sonnet不相上下。

更令人惊讶的是,DeepSeek-V3的训练成本仅为557.6万美元,而GPT-4o等模型的训练成本大约为1亿美元。这一消息一出,Deepseek瞬间刷屏。

天才少女罗福莉加入小米

12月27日,有媒体报道称,95后天才少女罗福莉将加入小米。而这位天才少女正是来自Deepseek。随后,雷军千万年薪挖角天才少女的报道也引发了热议。

事实上,早在12月20日就有媒体报道过罗福莉将加入小米的消息,但当时并没有称其为天才少女,也没有引起太大关注。而最近几天的热度突然上升,让人不禁猜测其中是否存在关联。

DeepSeek-V3的争议

DeepSeek-V3一经发布,便收获了众多好评。一方面是其在多个评测中的出色表现,另一方面则是其低廉的训练成本。DeepSeek-V3也给自己挖了一个坑。

有人发现,当用英文询问DeepSeek-V3它是哪家大模型时,它却给出了ChatGPT的答案。而用中文或给问题加上问号,DeepSeek-V3则能够正确回答。对此,DeepSeek官方尚未做出回应。

分析认为,出现这种情况可能是因为DeepSeek-V3的训练数据中包含了大量ChatGPT生成的文本,导致它记住了ChatGPT的某些输出,并错误地将自己识别为ChatGPT。

DeepSeek-V3的良好表现

尽管存在争议,DeepSeek-V3在回答其他问题时表现出了较强的能力。以下是几个典型的问题:

1个笼子里装着免子和鸡,一共有20个头,45只脚,请问免子和鸡各有多少只?

DeepSeek-V3先通过设方程,解出兔子的数量为2.5只,鸡的数量为17.5只。然后又指出,动物的数量应该是整数,这表明题目中给出的数据可能有误,或者问题本身存在矛盾。

9.11和9.9哪个数字大?

DeepSeek-V3给出了正确的答案。

蒸一个包子需要5分钟,蒸10个包子需要几分钟?

DeepSeek-V3也给出了正确答案。

为什么爸妈结婚没叫我参加婚礼?

DeepSeek-V3分析给出了四种原因。

麻辣螺丝钉怎么做?

DeepSeek-V3指出了螺丝钉不能食用,并给出了麻辣螺蛳的做法。
年度天才少女井喷 史上罕见的才女大爆发

AI界的拼多多

DeepSeek被称为AI界的拼多多,源于其今年5月发布的DeepSeekV2开源模型。该模型将推理成本降至每百万token仅1块钱,约等于Llama370B的七分之一,GPT-4Turbo的七十分之一。

DeepSeek的背后是其提出的崭新的MLA架构,将显存占用降到了传统MHA架构的5%-13%。同时,DeepSeek还开发了基于不同场景的多种压缩技术,进一步降低了成本。

结语

DeepSeek-V3作为一款开源模型,在性能和成本方面都表现出了不俗的实力。尽管存在一些争议,但其在回答问题时的良好表现也让人印象深刻。相信随着不断地迭代和改进,DeepSeek将成为人工智能领域的一股不可忽视的力量。

© 版权声明

相关文章

暂无评论

none
暂无评论...