你的位置: 欧博会员 > 欧博网址 > 排列五娱乐城万博博彩app最新版本_AI「明天指南」!OpenAI安全团队谨慎东说念主:AI Agent「详备教程」
热点资讯

排列五娱乐城万博博彩app最新版本_AI「明天指南」!OpenAI安全团队谨慎东说念主:AI Agent「详备教程」

发布日期:2024-04-16 11:54    点击次数:186
排列五娱乐城万博博彩app最新版本_

近期北京赛车龙虎斗,AI Agent再度在圈内爆火。

皇冠hg86a

所谓AI Agent,其实等于LLM(大谈话模子)Agent,每次迭代时,它们齐会生成自我导向的指示和操作,不错贯穿成一个约略自动践诺任务的「机器东说念主」。

由于它不错合并到各式数据源,并通过API与环境进行交互,是以这个「机器东说念主」又存在着好多类型,每个类型齐有特殊的手段,比如搜索网页、与文档库交互,乃至通过自问自答的面目治理问题。

那么,种植这么一个AI Agent到底包含了哪些内容,不错提供什么样的才智?

6月底,OpenAI的Safety团队的谨慎东说念主Lilian Weng发布了一篇6000字的博客,详备先容了AI Agent,并以为,这将使LLM转为通用问题治理决议的路线之一。

本文将证实这篇博客纪念一下对于AI Agent的干系内容。

AI Agent简介

AI Agent组成部分

权谋(Planning)

皇冠客服飞机:@seo3687

万博博彩app最新版本

记挂(Memory)

器用使用(Tool Use)

权谋(Planning)

任务领悟(Self-Reflection)

自我反省(Self-Reflection)

记挂(Memory)

皇冠博彩平台最近推出全新博彩游戏赛事直播,包括、欧洲杯、NBACBA多个热门赛事。提供博彩攻略技巧分享,您博彩游戏中尽情享受乐趣收益。平台操作简便,充值提款方便快捷,您最佳博彩选择。

记挂类型

最大内积搜索(MIPS)

器用使用(Tool Use)

AI Agent 简介

所谓AI Agent,等于一个以LLM为中枢鸿沟器的一个代理系统。业界开源的名目如AutoGPT、GPT-Engineer和BabyAGI等,齐是近似的例子。

澳门皇冠现金网

LLM的后劲不单是是生成写得很好的副本、故事、散文和表率;它不错被框架为一个顽强的一般问题治理者。

也等于说,AI Agent本色是一个鸿沟LLM来治理问题的代理系统。LLM的中枢才智是意图贯穿与文本生成,如果能让LLM学会使用器用,那么LLM本人的才智也将大大拓展。AI Agent系统等于这么一种治理决议。

以AutoGPT为例,一个经典的案例是对大模子输入一个问题:找出一个投资契机。通俗情况下,一个LLM是无法给出具体的操作的。

而AutoGPT的念念路,是领先告诉LLM,这个问题LLM一般不错咋治理这个问题,给出几个罗致,然后LLM会挑选一个递次,可能是浏览雅虎财经,也可能是阅读某个文献,然后AutoGPT本人就不错证实罗致的恶果络续践诺,这种践诺可能是用谷歌搜索,也可能径直拜谒某个文献,但这些齐是LLM无法作念到的。

AutoGPT完成这些任务之后络续带上之前的纪录发给LLM,络续商酌新的治理决议。这等于一个简单的AI Agent的案例。

AI Agent 组成部分

所谓AI Agent,等于一个以LLM为中枢鸿沟器的一个代理系统。业界开源的名目如AutoGPT、GPT-Engineer和BabyAGI等,齐是近似的例子。

那么,为了完成上述才智,实验上一个AI Agent系统需要包含几个主要的部分。Lilian Weng以为一个AI Agent系统应当包含如下图所示的几个部分:

1、权谋(Planning)

优质服务赌球哪个软件最好

子指标和领悟:代理将大型任务领悟为更小、易于经管的子指标,从而达成复杂任务的高效处理。

反念念和提真金不怕火:代理不错对往常的步履进行自我品评和自我反念念,从造作中吸取履历,并为明天的设施立异它们,从而提高最终恶果的质地。

2、记挂(Memory)

短期记挂:通盘的高下体裁习,齐是讹诈模子的短期记挂来学习。

(参见请示工程:https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/)

长期记挂:这为代理提供了在很长一段时刻内保留和调用(无尽)信息的才智,不时是通过讹诈外部矢量存储和快速检索。

3、器用使用(Tool Use)

代理学会调用外部API以获得模子权重中阑珊的非常信息(在预教练后不时难以鼎新),包括现时信息、代码践诺才智、对特有信息源的拜谒等。

底下,对每个部分进行详备的诠释。

权谋 Planning

复杂的任务不时波及许多设施。AI Agent需要知说念他们是什么,并提前运筹帷幄。

1、任务领悟(Self-Reflection)

任务领悟主如果的方针是将复杂的任务领悟成简单的小任务,这么LLM不错更简单地治理问题。

这里先容2类递次:

1)念念维链已成为增强复杂任务模子性能的表率请示技艺(Prompt Technology)。精真金不怕火等于让模子“一步一阵势念念考”,讹诈更多的测试时刻运筹帷幄将困难任务领悟为更小、更简单的设施。CoT将大型任务转动为多个可经管的任务,并对模子的念念维过程进行了阐释。

2)念念想树(姚等东说念主2023年)通过在每一步探索多种推理可能性来推广CoT。它领先将问题领悟为多个念念维设施,并每一步生成多个念念维,创建一个树结构。搜索过程不错是BFS(广度优先搜索)或DFS(深度优先搜索),每个状态齐由分类器(通过请示)或多数票评估。

2、自我反省(Self-Reflection)

自我反省是一个贫窭的方面,它允许AI Agent通过完善往常的行径决策和改革以前的造作来迭代地立异。它在现实天下中发扬着至关贫窭的作用,在现实天下中,试错是不成幸免的。

这里也包含几种递次:

ug环球直营网

1)ReAct(姚等东说念主2023年)通过将动作空间推广为特定于任务的龙套动作息兵话空间的组合,将推理和步履集成在LLM中。前者使LLM约略与环境交互(举例使用维基百科搜索API),此后者则请示LLM以当然谈话生成推理追踪。

外交部:“美香”“添添”和“小奇迹”年底按期回国

老虎机在线娱乐场

2)Reflexion(Shinn & Labash 2023)是一个为代理配备动态记挂和自我反念念才智以提高推理才智的框架。Reflexion 具有表率的强化学习(Reinforcement Learning,RL)建树,其中奖励模子提供简单的二进制奖励,而行径空间则沿用 ReAct 中的建树,即在特定任务的行径空间中加入谈话,以达成复杂的推理设施。每次行径后,AI Agent管帐算一个启发式的值,然后证实自我反念念的恶断然定重置环境以开动新的老练。

3)Chain of Hindsight(CoH;Liu 等东说念主,2023 年)通过向模子明确展示一系列往常的输出恶果,饱读吹模子立异我方的输出恶果。

记挂 Memory

记挂(Memory),是近似多轮对话中记取之前的输入和设定的一种才智。在现时的大模子架构中,跟着对话的增长,要记取之前用户的输入内容再输出需要耗尽多数的硬件资源。大多数模子支合手的高下文长度齐口舌常有限的。

皇冠备用网址

超过这个长度之后,大多数模子的性能齐会极具下落或者是不支合手。可是长高下文是治理实验问题中必须要濒临的。如代码生成、故事续写、文本摘抄等场景,撑合手更长的输入不时意味着更好的恶果。

排列五娱乐城

在这里,Lili Weng先是纪念了一下东说念主类的记挂分类纪念,然后对应到大模子上区别是什么样的。

1、记挂类型

记挂不错界说为用于获得、存储、保留和检索信息的过程。东说念主类大脑中有几种类型的记挂。

感官记挂(Sensory Memory):这是记挂的最早阶段,约略在原始刺激斥逐后保留对感官信息(视觉、听觉等)的印象。感官记挂不时只可合手续几秒钟。其子类别包括图标记挂(视觉)、回声记挂(听觉)和触觉记挂(触觉)。

短时记挂(Short-Term Memory,STM)或责任记挂:它存储咱们现时富厚到的信息,以及践诺学习和推理等复杂融会任务所需的信息。

万古记挂(Long-Term Memory,LTM):万古记挂不错将信息存储很万古刻,从几天到几十年不等,存储容量基本上是无尽的。万古记挂有两种亚型:

显性/述说性记挂:这是对事实和事件的记挂,指那些不错有富厚地回忆起的记挂,包括外显记挂(事件和经历)和语义记挂(事实和见解)。内隐/表率性记挂:这种记挂是无富厚的,波及自动践诺的手段和例行表率,如骑车或在键盘上打字。咱们不错精真金不怕火商量将上头的记挂类型对应到底下几个部分:感官记挂是近似大模子学习原始输入(包括文本、图像或其他阵势)的镶嵌表征;短时记挂不错贯穿为大模子的高下体裁习,近似于prompt。由于受到 Transformer 有限高下文窗口长度的斥逐,它是倏得和有限的,可是不错每次输入齐引入。长期记挂一般等于大模子以外看成外部向量存储的数据了,AI Agent可在查询时加以关怀,并可通过快速检索进行拜谒。那么,在外部数据检索的时候也需要商量一些递次。这里提供一种经典的递次。2、最大内积搜索(MIPS)外部存储器不错缓解有限注见地的斥逐。表率的作念法是将信息的镶嵌暗示保存到向量存储数据库中,该数据库可支合手快速的最大内积搜索(MIPS)。为了优化检索速率,不时罗致近似隔壁(ANN)算法来复返近似的前 k 个隔壁,从而以亏损的少许精度同样顽强的速率晋升。器用使用 Tool UseLLM,本人最强的是文本识别、意图贯穿等,可是对于运筹帷幄等操作可能还不如传统运筹帷幄器。因此,为LLM配备一些器用不错大大晋升LLM的才智,这里先容几个干系的连络(居品)。1、MRKL(Karpas等东说念主,2022 年)是 “模块化推理、常识息兵话 “的简称,是一种用于自主代理的神经标志架构。MRKL 系统包含一系列 “群众 “模块,通用 LLM 用作路由器,将查询路由到最合适的群众模块。这些模块不错是神经模块(如深度学习模子),也不错是标志模块(如数学运筹帷幄器、货币转机器、天气 API)。Karpas等东说念主使用算术看成测试案例,对LLM进行了微调实验,以调用运筹帷幄器。他们的实验标明,治理口述数学问题比治理明确述说的数学问题更难,因为LLM(7B Jurassic1-large model)无法可靠地索求基本算术的正确参数。这意味着当外部标志器用约略可靠地责任时,了解何时以及怎样使用这些器用至关贫窭,这取决于 LLM 的才智。2、TALM(器用增强谈话模子;Parisi 等东说念主,2022 年)和 Toolformer(Schick 等东说念主,2023 年)齐对 LM 进行了微调,使其学会使用外部器用API。数据集证实新添加的API调用疑望是否能提高模子输出的质地进行推广。ChatGPT Plugins 和 OpenAI API 函数调用是增强器用使用才智的 LLM 在实践中发扬作用的细致规范。器用 API 的集中不错由其他开荒东说念主员提供(如插件),也不错自行界说(如函数调用)。3、HuggingGPT(Shen 等东说念主,2023 年)是一个使用 ChatGPT 看成任务权谋器的框架,可证实模子描摹罗致 HuggingFace 平台中可用的模子,并证实践诺恶果纪念反应。HuggingGPT包含四个设施:任务权谋、模子罗致、任务践诺和反应生成。4、API-Bank(Li 等东说念主,2023 年)是评估器用增强 LLM 性能的基准。它包含 53 种常用的 API 器用、一个齐全的器用增强 LLM 责任经由以及 264 个疑望对话,其中波及 568 次 API 调用。API 的罗致荒芜千般化,包括搜索引擎、运筹帷幄器、日期查询、智能家居鸿沟、日程经管、健康数据经管、账户认证责任经由等。由于 API 数目宽敞,LLM 领先不错拜谒 API 搜索引擎,找到要调用的 API,然后使用相应的文档进行调用。

本文来自硬AI北京赛车龙虎斗,原文标题:《AI「明天指南」!OpenAI安全团队谨慎东说念主:AI Agent「详备教程」》

风险请示及免责条目 商场有风险,投资需严慎。本文不组成个东说念主投资提议,也未商量到个别用户特殊的投资指标、财务景色或需要。用户应试虑本文中的任何意见、不雅点或论断是否适当其特定景色。据此投资,背负安静。

----------------------------------