在对OpenAI的闭门策略多次表示不满之后,特斯拉的创始人埃隆·马斯克于3月18日兑现了他的承诺,公布了开源的大型语言模型Grok-1。这个模型是由他的人工智能初创公司xAI独立训练的,它是一个多专家系统模型,并未针对特定场景进行优化。Grok-1模型的参数数量达到了惊人的3140亿,成为目前开源界最大的模型。

马斯克的商业哲学和对OpenAI的态度

马斯克在社交媒体上对OpenAI的“开放性”进行了讽刺,而OpenAI则回应称马斯克“抄袭了他们的笑话”。马斯克,这位科技界的领军人物,以其复杂的性格而闻名。在《埃隆·马斯克传》一书中,作者将他描述为“冷静”、“冲动”和“充满热情”的人。李明顺,行行AI的董事长,曾访问过中美的众多AI前沿企业,并与马斯克就其宏伟的梦想——在火星上建立城市——进行了交流。他认为马斯克是一位“罕见的地球企业家”,不仅仅关注商业利益。

Grok-1模型的发布及其影响

Grok-1的开源可能会引领AI领域的新趋势,并可能对Llama-2的地位构成挑战,这是对OpenAI的一种反击。马斯克意在通过这一行动,强调自己的世界观和价值观。盘古智库的高级研究员李培序认为,马斯克开源Grok-1是一种“行为艺术”,旨在建立一个更加开放和协作的AI生态系统。

马斯克在AI领域的抱负

马斯克与OpenAI的关系可以追溯到十年前。2015年,他与山姆·奥特曼等人共同创立了OpenAI,但由于理念上的分歧,双方在2018年分道扬镳。此后,马斯克对OpenAI的发展方向提出了多次批评。
据路透社报道,马斯克于今年2月29日向美国旧金山高等法院提起诉讼,控告OpenAI及其CEO山姆·奥特曼,理由是OpenAI背离了其最初的使命——为全人类的福祉而非利润开发AI技术。OpenAI则在官网上发表文章回应,表示将驳回马斯克的所有主张。

Grok-1的性能和挑战

Grok-1在开源后的5天内,在GitHub上获得了4.2万的星标。DeepMind的工程师亚历克萨·戈迪奇预测,Grok-1的性能可能超过Llama-2,但目前尚不清楚数据的完整性如何。尽管两者的参数量存在差异,Grok-1的大参数量对用户来说是一个挑战。有用户在GitHub上指出,运行Grok-1需要8个英伟达A100芯片的GPU配置。xAI也强调,鉴于Grok-1模型的大规模,需要有足够的GPU内存来测试模型。

开源与闭源的辩论

开源大模型允许所有人访问和使用其源代码,而闭源模型则由单一实体控制,通常需要付费。这类似于IT产业中Windows与Linux、iOS与Android的竞争历史。开源支持者认为,开源有助于技术和监管透明,推动共同进步;而闭源支持者则认为,闭源有助于防止AI技术的滥用。

开源大模型的优势在于能够吸引全球开发者共同参与改进和优化,形成一个强大的社区支持网络。然而,开源模型也面临更高的安全风险和盈利模式的挑战。闭源模型则更容易形成商业模式,提供定制化服务,但可能缺乏开源模型那样的社区支持和协作环境。未来,大模型的发展趋势可能是开源与闭源模式的融合,既保持开源性,又通过合理的商业模式平衡创新与盈利。

By 康康