AgentTuningPaper解析
开源的LLM在许多领域都有惊人的表现,但是比起商用模型还差很多。这些agent使用LLM作为中心控制器去完成各种任务,需要细粒度的prompt方法和robust LLM来达到令人满意的效果。虽然很多prompt方法已经被提出,但是缺乏一些不损失LLM的通用能力,而关注LLM本身的研究。这篇工作提出AgentTuning,一种简单并且通用的方法来增强LLM的agent能力,同时又保持LLM的通用能力。同时这篇工作提出AgentInstruct,一个轻量级的instruction-tuning数据集。实验以Llama2系列为基座,在AgentInstruct和其他开放数据集上训练,得到的AgentLM-70B与GPT-3.5-turbo在unseen agent任务上能力相当。
总结是,...
Langchaingraph与LCEL解析
Langchain 介绍
我们来快速回顾一下 Langchain,LangChain 是一个用于开发由语言模型驱动的应用程序框架,从诞生以来,Langchain 就成为了 LLM 开发者几乎必须了解的框架,Langchian 中提出/应用了相当重要的概念如:
LLMs
Prompt Templates
Chains
Agents and Tools
在他们的设计中 LLMs 用来包装与大模型(包括本地与 API 服务)交互的基本接口,任何模型在使用前都必须被 LLM 类重写,之后就可以按照 langchain 的需要来调用这些模型
Prompt Templates 则是用来帮助生成与大模型交互内容的基本模板,为了避免用户去撰写重复复杂的提示词,langcha...
Opmmlab大模型实战营笔记
第一章 书生·浦语大模型全链路开源体系
这一章主要梳理了一下大模型的发展历史和 Openmmlab 在这个赛道的一些积累和布局,总体来说我还是很看好 Openmmlab 的前景,因为 Openmmlab 在技术上还是有很深的积累,但是在 Agent 赛道上可能表现还是没有我关注的其他企业做的好一些,不过一切都未来可期 ~
书生浦语大模型
目前是有轻量级7B,中量级20B, 重量级123B三个版本,只适用过 7B 表现中规中矩
开源数据
opendatalab平台提供丰富多样的数据集,之前实验的时候在上面找过一些图像的数据集,但是感觉这种数据平台各家都在做,没什么特色
XTuner
xtuner确实牛逼,loar,Qloar 的训练,显存需要都有很大的下降,而且log这些做的...
A※算法求解迷宫问题
\documentclass{article}
\usepackage{graphicx} % Required for inserting images
\usepackage[chinese]{babel}
\usepackage[UTF8]{ctex}
\usepackage{float}
\usepackage[letterpaper,top=2cm,bottom=2cm,left=3cm,right=3cm,marginparwidth=1.75cm]{geometry}
\usepackage{listings}
\usepackage{authblk}
% Useful packages
\usepackage{amsmath}
\usepackage{subfigure...
Metagpt_agent架构解析
MetaGPT框架组件教程
1. Agent组件介绍
1.1 Agent概念概述
在MetaGPT看来,我们把Agent想象成环境中的数字人,其中
Agent = 大语言模型(LLM) + 观察 + 思考 + 行动 + 记忆
这个公式概括了智能体的功能本质。为了理解每个组成部分,让我们将其与人类进行类比:
大语言模型(LLM):LLM作为智能体的“大脑”部分,使其能够处理信息,从交互中学习,做出决策并执行行动。
观察:这是智能体的感知机制,使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
思考:思考过程涉及分析观察结果...
MetaGPT组件介绍以及快速上手
获取MetaGPT
本章节内我们将详细介绍如何获取MetaGPT
MetaGPT提供了几种安装的方式,我们可以根据自己的需求来选择安装的方式
请确保你的系统已安装Python 3.9+。你可以通过以下命令进行检查:
python3 --version
使用pip获取MetaGPT
metagpt可以直接用 pip 来获取至本地环境中,这样我们就可以在像使用任何python包一样导入MetaGPT
通过在终端内运行下面的代码来获取稳定版metagpt
pip install metagpt
通过在终端内运行下面的代码来获取最新版metagpt来体验最新功能
pip install git+https://git...
Agentverse_Env模块解析
Agentverse 介绍
AgentVerse 提供了一个多功能的框架,简化了为大型语言模型(LLMs)创建自定义多智能体环境的过程。旨在快速、低成本的开发和定制,我们的框架赋能研究人员专注于他们的研究,而不被实现细节所困扰。
paper
AgentVerse Env 组件设计
AgentVerse 的核心在于 环境组件的设计,他们为环境定义了如下的基础组件:
Describer(描述器):此组件为每个智能体在每一轮提供环境的描述。您可以自定义描述器来定义他们的环境的具体要求,例如一个智能体可以与哪些智能体互动。
Order(顺序):此组件定义智能体在环境中采取行动的顺序。您可以自定义顺序以反映智能体之间所需的交互。我们提供了几个基本的顺序选项,包括random(随机),...
Agent Muti-Agent以及Muti-Agent框架概述
Agent Muti-Agent以及Muti-Agent框架概述
Overview
本次分享介绍的内容
1 Agent概念介绍
2 已有的Single-Agent与Muti-Agent介绍
3 Muti-Agent framework
4 总结与趋势
5 文章引用
Agent概念介绍
强化学习
强化学习
强化学习(Reinforcement Learning)是一种机器学习方法,它旨在让一个智能体(Agent)通过与环境的交互来学习如何做出决策,以最大化累积奖励或实现特定目标。
为什么要先介绍RL中的Agent呢?
一方面是大模型的训练离不开RL的帮助,而基于大模型的Agent与RL也存在关联
另一方面是我觉得目...
20 post articles, 3 pages.