「开源」0代码调戏千亿参数大模型,打开网页就能玩!无需注册即可体验
原文标题:0代码调戏千亿参数大模型,打开网页就能玩!无需注册即可体验
想体验千亿参数大模型的门槛,真是越来越低了!
想让大模型回答问题?
只需在网页端输入问题,运行二三十秒,答案就噌噌生成了。
用的正是今年由 Meta 开源的 Open Pretrained Transformer(OPT),参数量达1750 亿。
如果是传统在本地运行,对算力可是个大考验。
这就是由开源项目 Colossal-AI支持的云端 demo,无需注册即可上手体验,对硬件完全没门槛,普通笔记本电脑甚至手机就能搞定。
也就是说,完全不用懂代码的小白,现在也能调戏 OPT 这样的大模型了。
让我们来试玩一把 ~
4 种任务可试玩
FAQ 常见问题解答、聊天机器人、翻译、文章创作几种模式都可试玩。
一些数值也能按需自己来调整,并且不涉及到代码。
我们体验了下文章创作,开头给了一句 " 今天是个好日子啊 "。
很快,网页就输出了一连串大好事,刚刚加薪、正在玩刺客信条、明天还要去海滩……看着让人羡慕!
还能构建个场景让聊天机器人唠上几块钱的。
随机生成的一段长对话是买手机的场景。嗯,和今天 iPhone 14 发布可以说是非常应景了。
感觉即便是不懂 AI、不懂编程的小白也能玩转 OPT 的各种任务,体验过程相当丝滑。
要知道,像 OPT 这样千亿参数大模型的运行,一直都有着 " 对硬件要求高 "、" 成本高 " 的特点。
一个免费无限玩的网站,到底是怎么实现如上效果的?
开源方案快速云上部署超大模型
这还是要从其背后支持系统 Colossal-AI 说起。
它以 "仅需几行代码就能快速部署 AI 大模型训练推理 " 而名震江湖,在 GitHub 上揽星超过 4.7K。
这一次,是它在云上部署 AI 大模型的一次新突破。
主要针对 OPT 模型的特性,做出了在推理速度、计算量等方面的优化。
在 OPT 云上服务方面,提出了 left padding、past cache、bucket batching 技术。
OPT 拥有 1750 亿参数量,如此规模的模型,单个 GPU 显存显然无法容纳。
而且推理问题不光要考虑吞吐量,还要顾及到时延问题。
针对这两方面问题,并行计算是个不错的解决思路。
尤其是 Colossal-AI 本身就十分擅长将一个单机模型转换成并行运行,获得并行 OPT 模型自然不成问题。
不过并行方案中的参数加载一直是个难题。
在这方面,Colossal-AI 可以让用户只需要参考样例,简单提供参数名映射关系,即可完成模型参数的加载。
最后,再将模型导入到 Colossal-AI 的推理引擎中,设置相应的超参数。
到这一步,OPT 主干网络的推理部分就能上线且输出有意义的结果了。
但是这还远远不够。
因为 OPT 是生成式模型,生成式任务需要不断循环模型的输出结果,这就导致推理中常见的batching 策略无法直接应用。
具体来看,由于生成任务输入的语句长度往往参差不齐,而且大部分语言阅读和书写都是从左向右的。
如果用常规的right padding,那么针对较短的句子就很难生成有意义的结果,或者需要进行复杂处理。
△使用 Right padding,生成侧不对齐
如果用单 batch 运行,效率又太低了,不可行。
所以这一回的推理部署中,增加了 left padding 对句子进行填充,让每个句子的生成侧(右侧)都是对齐的,同时可以生成新的单词。
△Left padding
还有另一方面的问题——生成模型单次推理只能生成一个新词。
当新的输出结果生成时,它同时也成为了输入的一部分。
也就是说,生成式任务的每次计算,是需要针对新的输入序列进行重新计算的。
显然这种操作方式,重复计算太多了。
尤其是对于占绝大多数计算量的 Linear 层来说。
所以,Colossal-AI 的开发人员在模型内部引入了past cache 技术。
它可以暂存同一次生成任务中的 Linear 层的输出结果,让每次只有一个新的单词进入 Linear 层进行计算,并把该次的计算结果暂存,以避免重复计算。
直观来看就是酱婶儿的:
除此之外,开发人员还注意到生成式任务的计算量是参差不齐的。
输入、输出的句子长短变化范围都很大。
如果用简单的 batching 方法,将两个相差很大的推理放在同一个批次里,就会造成大量的冗余计算。
因此他们提出了bucket batching。
即按照输入句长以及输出目标句长进行桶排序,同一个桶内的序列作为一个 batching,以此降低冗余。
One More Thing
不光是这次的云端 demo,提供支持的 Colossal-AI 也是免费开源的 ~
任何人都能基于它低成本训练自己的大模型,并部署成云端服务。
比如在单张 10GB 显存的 RTX 3080 上,就能训练120 亿参数的大模型。
较原生 PyTorch 提升了120 倍的模型容量。
此前 Colossal-AI 多次在 GitHub、Paper With Code 热榜位列世界第一。
相关解决方案成功在自动驾驶、云计算、零售、 医药、芯片等行业知名厂商落地应用。
最近,Colossal-AI 还连续入选和受邀全球超级计算机大会、国际数据科学会议、世界人工智能大会、亚马逊云科技中国峰会等国际专业盛会。
对 Colossal-AI 感兴趣的小伙伴,可以关注起来了 ~
传送门
项目开源地址:
https://github.com/hpcaitech/ColossalAI
云端 demo 体验地址:
https://service.colossalai.org/
参考链接:
[ 1 ] https://arxiv.org/abs/2205.01068
[ 2 ] https://sc22.supercomputing.org/
[ 3 ] https://medium.com/@yangyou_berkeley/using-state-of-the-art-ai-models-for-free-try-opt-175b-on-your-cellphone-and-laptop-7d645f535982
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
其他人还看了
「马修」Copilot要摊官司了!工作20年老程序员重新激活律师证,发起集体诉讼,
「高通」高通向安卓AOSP捐赠aptX与aptXHD编解码器源代码
龙芯全国产处理器2K1000LA完成开源鸿蒙OpenHarmony兼容性适配
「英特尔」英特尔JoshNewman:真正满足用户所需让人们享受专注与互联的PC体验
郑重声明:本文“「开源」0代码调戏千亿参数大模型,打开网页就能玩!无需注册即可体验”,https://nmgjrty.com/shumacp_596853.html内容,由量子位提供发布,请自行判断内容优劣。
- 全部评论(0)
- 大香煮伊区一二三四区2021维护成功,可以无限制进出了!
- 大香煮伊区一二三四区2021不再收费了!网友:终于可以免费看了
- 大香煮伊区一二三四区2021不再收费!网友:可以白嫖了
- 一卡二卡3卡4卡视频免费播放重新开放了!网友:久违了
- 一卡二卡3卡4卡视频免费播放出入无限制!网友:平台都这样才好!
- 一卡二卡3卡4卡视频免费播放人气暴涨!网友:毕竟来了很多大主播!
- 欧美xbox和ps大片重新开放了!网友:久违了
- 欧美xbox和ps大片人气暴涨原因,无限制出入是关键!
- 欧美xbox和ps大片免费播放!网友:已经来了不少
- 成品网站w灬源码1688直播身材好!网友:比明星还赞!
- 成品网站w灬源码1688直播更新引热议!上线了多种新功能!
- 成品网站w灬源码1688直播适合晚上看!粉丝:我们懂!
- XXXXXL19waswas重新开放,并且免费使用!
- XXXXXL19waswas不再收费了!网友:终于可以免费看了
- XXXXXL19waswas不再收费!网友:付费内容都取消了
- Japonensisjavacomplete重新开放!网友:爷青回!
最新更新
- 大香煮伊区一二三四区2021维护成功,可以
- 大香煮伊区一二三四区2021不再收费了!网
- 大香煮伊区一二三四区2021不再收费!网友
- 一卡二卡3卡4卡视频免费播放重新开放了
- 一卡二卡3卡4卡视频免费播放出入无限制
- 一卡二卡3卡4卡视频免费播放人气暴涨!
- 欧美xbox和ps大片重新开放了!网友:久违
- 欧美xbox和ps大片人气暴涨原因,无限制出
- 欧美xbox和ps大片免费播放!网友:已经来
- 成品网站w灬源码1688直播身材好!网友:
- 成品网站w灬源码1688直播更新引热议!上
- 成品网站w灬源码1688直播适合晚上看!粉
- XXXXXL19waswas重新开放,并且免费使用!
- XXXXXL19waswas不再收费了!网友:终于可以
- XXXXXL19waswas不再收费!网友:付费内容都
推荐阅读
- 「生物」我们应该寻找什么样的外星生命,高等的还是低等的?
- 「空间望远镜」韦布空间望远镜捕捉到布满恒星的创生之柱
- 「行者」从《双城之战》到《边缘行者》,游改动画迎来盛世?
- 「国际象棋」智能肛珠作弊案反转:19岁小将告世界冠军诽谤索赔7亿
- 「英伟达」不止是游戏党,他们才是被英伟达坑怕的人。
- 「索尼」索尼官宣!猜猜A7R5多钱?R2要价1.9万、R3要价2.4万、R4要价2.7万……
- 「癌症」一种癌症转移的关键因素
- 「智能手表」面世八年后,谷歌的智能手表生态终于迎来开放曙光
- 「adobe」用VR手捏3D模型,PS直接与甲方对线,Adobe新技术确实给设计师炫到了
- 「amd」RTX40的对手来了!AMDRDNA3显卡发布会官宣
- 「奥斯汀」苹果M3准备登场,库克展示奥斯汀AppleSilicon工程团队努力成果
- 「马修」Copilot要摊官司了!工作20年老程序员重新激活律师证,发起集体诉讼,
猜你喜欢
- [iPhone]iPhone13promax远峰蓝128G入手
- [安卓手机]realme真我GTNeo2开箱,金刚石冰芯散热系统+E4屏,5000mAh大电池
- [贴膜]红米9爆屏更换记录,弯曲的中框修复
- [智能机器人]编程从娃娃抓起,MakeBlock程小奔上手体验
- [智能摄像机]内置大电池,无需打孔走线,小米室外摄像机给你满满的安全感
- [充电器]65w网红氮化镓一次看个够
- [电脑支架]原汤化原食,LGErgo显示器支架
- [蓝牙耳机]中端耳机音质天花板,降噪很有一手,鹿图COCO真蓝牙降噪耳机评测
- [音频播放器]关于R01主板的主观看法,和一些碎碎念
- [充电器]双口快充,满足日常需求
- [VR设备]GOOVISLite头戴影院评测
- [蓝牙耳机]魅蓝Blus耳机体验,魅蓝依旧还是当年坚持做良品的青年良品
- [安卓手机]从5988跌至2749,256GB+鸿蒙OS+7nm麒麟,从高端市场跌至中端市场
- 「轻众测|素诺智能可视冲牙器」别急,对准再冲!素诺可视冲牙器让残渣无所
- 「九号新品Nano及Air T15」萌娃初体验——Ninebot九号平衡车Nano