2025年将至关重要。我认为我们必须意识到这一刻的紧迫性,并需要作为一家公司加快步伐。风险很高。这些都是颠覆性的时刻。在2025年,我们需要坚持不懈地专注于释放这项技术的优势并解决真正的用户问题。
——谷歌首席执行官桑达尔·皮查伊
听起来像是公司生死存亡的时刻,但事实远没有到这地步。谷歌刚刚经历了一个扬眉吐气的12月,当然扬眉吐气之前是灰头丧气。而在2023-2024年针对性地训练和运行AI模型,2024年12月谷歌的新一代大模型Gemini2.0就是基于第六代TPU训练得来。
2017年,谷歌推出了新型神经网络架构Transformer,奠定了生成式AI系统的基石。2019年2月,GPT-2正式基于Transformer架构的语言模型,随后催生了GPT-3.5、GPT4.0,GPTo1等等。遗憾的是,谷歌自己的初代大模型反而不是基于Transformer架构。
竞争来的太快太急
为了应对2022年底GPT-3.5的爆红,2023年2月6日谷歌发布大模型Bard,3月份首批在美国和英国推出。初代版本的Bard,是基于谷歌2021年发布的LaMDA(Language Models for Dialog Applications)大模型。这款模型具有多达1370亿个参数,更注重自然对话能力,对于信息和数据处理的能力不够强,因此在巴黎的直播发布会中表现不佳,导致谷歌的股价下跌了8%。谷歌内部和媒体纷纷批评和质疑谷歌的大模型能力。
我们的测试中,也发现和ChatGPT相比,Bard更像是上个时代的产物,对话效果比Apple的Siri好不了多少。2023年4月10日,Bard的底层模型升级为更强大的通用语言模型PaLM(Pathways Language Model)。和前代LaMDA模型相比,PaLM拥有更强大的语言理解和生成能力,对话过程更为流畅自然。5月10日,Bard升级为PaLM2大模型,在PaLM的基础上增加大大提升了逻辑推理能力,来减少对话中的笑话。谷歌在这个阶段开始了大模型和自身产品的集成,从PaLM2开始大模型已经为多款Google产品提供生成式AI功能,包括Gmail和Workspace等。
一直到2023年12月,Bard才再次迎来大升级,谷歌官方给出的表现报告显示Gemini Pro性能表现全面超越GPT-3.5和ChatGPT。这次升级后,Bard终于赢得了业界的认可和尊重,谷歌的股价也随之飙升。谷歌的这场大模型争夺之旅却远未结束。
艰难的竞争和不确定的未来
随着ChatGPT的爆火,大模型赛道将迎来更多的竞争者,微软、Meta、百度、阿里巴巴等科技巨头都已入局。对于谷歌来说,如何巩固自己在这一领域的领先地位,如何抓住移动互联网向智能互联网转移的机遇,将是其未来一段时期内最大的挑战。同时,大模型的商业化路径也尚不明朗,谷歌需要在技术创新和商业模式探索之间找到平衡点。未来是否掌握在谷歌手中,只能交给时间去验证。