当前位置:综合 > 正文
我在iPhone上装了70亿参数大模型,来自陈天奇团队最新成果 每日消息
2023-06-08 02:13:33 来源: 互联网

MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。


(资料图片)

社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。

转载自 | 量子位

作者 | 克雷西

跑大语言模型的门槛,已经降低到一部iPhone了。

当然安卓版本也有,只要手机RAM够6G,听上去是不是比用2060还要震撼?

而且这次还是开箱即用的版本!

这个项目名为MLC LLM,与之前的WebLLM同出自知名学者陈天奇团队。

截止目前已在GitHub上斩获超6800星。

目前可以测试的模型有羊驼家族(基于LLaMA)的RedPajama和Vicuna。

可选模型参数分别为30亿和70亿,与很多在线Demo规模也相当了。

RedPajama团队表示,这一成果打开了大模型私有化部署的可能性。

话不多说,快来看看体验如何。

文字功底尚可,但理科是短板

我们选择了其中的Vicuna模型进行测试。

首先测试一下它的文学造诣,于是让它为四个季节分别写了一首诗。

韵律吗,基本上是两三句一押。

除了诗歌,故事也能创作,甚至还能写出内心戏来。

不只是爱情,其他类型的故事也难不倒它。

除了文学上的应用,我们不妨再来试试它的实用功能。

我们让它生成了一道夏威夷披萨的菜谱,看上去还蛮不错。

旅游计划也可以让它来安排。

我们再来看看它在理工科上的表现怎么样。

首当其冲的是代码,我们让它尝试用Python写了一段寻找最大数的代码。

想不到上来就是一通枚举……不过结果倒也是符合要求。

defmax_of_three(num1,num2,num3):ifnum1>num2andnum1>num3:returnnum1elifnum2>num1andnum2>num3:returnnum2elifnum3>num1andnum3>num2:returnnum3returnNonenum1=11num2=45num3=14max_value=max_of_three(num1,num2,num3)print("Themaximumvalueis:",max_value)

不过遇到稍难的问题,它的编程能力就有些捉襟见肘了。

至于数学和逻辑推理则一言难尽,不过毕竟为适配手机参数有限,倒也情有可原。

我们还试了试用中文进行提问,但发现目前对中文的适配还有些问题。

另外,移动APP目前还不具有保存聊天记录功能,切出界面时一定要小心小心再小心。

虽然目前能在手机上跑的大模型能力还有限,但团队也展示了未来更多发展方向。

比如为用户定制模型并与云端公共基础模型交互、提供离线支持、App嵌入、去中心化等等。

如何安装

这款大模型支持iOS、安卓移动设备,以及Windows和Mac

iOS用户可以先安装好TestFlight,然后从下面的传送门申请测试:

传送门:https://testflight.apple.com/join/57zd7oxa

如果名额已满,也可以用GitHub上的代码自行编译安装

传送门:https://github.com/mlc-ai/mlc-llm

安卓用户直接下载apk安装即可,第一次运行时需联网下载数据包。

传送门:https://github.com/mlc-ai/binary-mlc-llm-libs/raw/main/mlc-chat.apk

桌面用户请参阅官方教程:

传送门:https://mlc.ai/mlc-llm/

技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向

(如:小张-哈工大-对话系统)

即可申请加入自然语言处理/Pytorch等技术交流群

MLNLP社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。

社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

关键词:
责任编辑:zN_0833