第一章 书生·浦语大模型全链路开源体系
这一章主要梳理了一下大模型的发展历史和 Openmmlab 在这个赛道的一些积累和布局,总体来说我还是很看好 Openmmlab 的前景,因为 Openmmlab 在技术上还是有很深的积累,但是在 Agent 赛道上可能表现还是没有我关注的其他企业做的好一些,不过一切都未来可期 ~
书生浦语大模型
目前是有轻量级7B,中量级20B, 重量级123B三个版本,只适用过 7B 表现中规中矩
开源数据
opendatalab平台提供丰富多样的数据集,之前实验的时候在上面找过一些图像的数据集,但是感觉这种数据平台各家都在做,没什么特色
XTuner
xtuner确实牛逼,loar,Qloar 的训练,显存需要都有很大的下降,而且log这些做的也比较好,在V100上也能训 qwen13B 我觉得很强,希望未来能够增加更多模型的cfg
大模型评测OpenCompass
听介绍感觉是一个更全面的测评体系,但是还没上手过,所以就不多写了
大模型部署LMDeploy
这个也是实用神中神,能够超快做低精度部署,推理速度也很快
智能体应用
Lagent 的优点,目前来看的话可能就是比较轻量,实现了react机制还有tools的调用,但是在 role-play sop 上可能还需要更多的探索
PREVIOUSA※算法求解迷宫问题