11月6日消息,近日,创新工场董事长兼CEO李开复带队创办的AI大模型创业公司零一万物宣布,正式发布首款研发的最强开源人工智能大模型系列Yi。
此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B,其数据参数量分别为60亿和340亿,均支持开源。
李开复表示:零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为世界第一的初衷和决心。
我们组成了一支有潜力对标 OpenAI、Google等一线大厂的团队,经历了近半年的厚积薄发,交出了第一张极具全球竞争力的耀眼成绩单。Yi-34B可以说不负众望,一鸣惊人。
从效果上来看,Yi系列大模型确实也可以称得上是后发制人。
在Hugging Face英文测试公开单Pretrained预训练开源模型排名中,Yi-34B以70.72分数位列全球第一,超过了LLaMA-70B和Falcon-180B,而其参数量仅为后两者的1/2和1/5。
在中文能力上,Yi-34B在C-Eval中文能力排行榜上超越所有开源模型,同样开源的Yi-6B也超过了同规模所有开源模型。
在CMMLU、E-Eval、Gaokao三个主要中文指标上,明显领先于GPT-4;在BooIQ、OBQA两个问答指标上,和GPT-4水平相当。
不过在发布中零一万物也表示,Yi系列模型在GSM8k、MBPP的数学和代码测评中表现还不及GPT模型,不过会在后期推出专长代码和数学的继续训练模型。
此外,Yi-34B还将大模型上下文窗口长度刷新到了200K,可处理约40万汉字超长文本输入,而GPT-4仅支持32K、约2.5万汉字。
李开复还表示,在完成Yi-34B预训练的同时,零一万物已经启动下一个千亿参数模型的训练。