什么是大语言模型?它是如何运作的

但你是否知道,人工智能聊天机器人的旅程早在 1966 年就从 ELIZA 开始了?ELIZA 并不像今天的 GPT 模型那样复杂,但它标志着一条激动人心的道路的开始,引领我们走向现在的智能境界。 语言是人类互动的本质,在数字时代,教机器理解和生成语言已成为人工智能的基石。 我们今天使用的模型(例如 GPT、Llama3、Gemini 和 Claude)被称为大型语言模型 (LLM)。这是因为它们是在大量文本数据集上进行训练的,因此能够执行各种与语言相关的任务。 但是大语言模型到底是什么?为什么它受到如此大的追捧?在本文中,您将了解 LLM 是什么以及它为何如此受关注。 什么是大语言模型 (LLM)? 大语言模型是使用大量文本数据进行训练的 AI 模型,用于理解、生成和操纵人类语言。它们基于 Transformer 等深度学习架构,能够以模仿人类理解的方式处理和预测文本。 简单来说,LLM 是一个计算机程序,它经过大量示例的训练,可以区分苹果和波音 787,并能够描述它们中的每一个。 在 LLM 准备好使用并回答你的问题之前,它们需要经过大量数据集的训练。实际上,程序无法从单个句子得出任何结论。但在分析了数万亿个句子之后,它能够建立逻辑来完成句子,甚至生成自己的句子。 如何训练大语言模型 大语言模型的训练过程,总结如下: 数据收集:第一步是从各种来源(包括书籍、网站、研究论文与社交媒体)收集数百万(甚至数十亿)份文本文档。这个庞大的数据集是模型学习过程的基础。 学习模式:模型分析收集的数据,以识别和学习文本中的模式。这些模式包括语法规则、词语联想、上下文关系,甚至某种程度的常识。通过处理这些数据,模型开始了解语言的运作方式。 微调:初始训练后,模型将针对特定任务进行微调。这涉及调整模型的参数以优化其在翻译、摘要、情绪分析或问答等任务中的表现。 评估和测试:训练完成后,将根据一系列基准对模型进行严格测试,以评估其准确性、效率和可靠性。此步骤可确保模型在实际应用中表现良好。 训练过程完成后,模型将根据准确性、效率、安全性等一系列基准接受严格测试。 大语言模型的应用 LLM 具有广泛的应用范围,从内容生成到预测等等。 内容创作: 写作辅助:Grammarly 等工具利用大语言模型 (LLM) 提供实时建议,以改善写作中的语法、风格和清晰度。无论您是在起草电子邮件还是在写小说,大语言模型 (LLM) 都可以帮助您润色文本。 自动讲故事:人工智能模型现在可以生成创意内容,从短篇故事到长篇小说。这些模型可以模仿著名作家的风格,甚至创造全新的文学风格。 客户服务: 聊天机器人:许多公司部署了人工智能聊天机器人,这些机器人可以实时理解并响应客户询问。这些聊天机器人可以处理各种任务,从回答常见问题到处理订单。 个人助理:Siri 和 Alexa 等虚拟助理使用 LLM 来解释和响应语音命令,为用户提供信息、提醒和娱乐。 卫生保健:…

七个加快编码速度的开源 AI 工具

当今世界已经出现不少的 AI 工具,不论是工作应用层还是代码层,开发者的工作效率应该比去年提高了不少。 这里向各位总结推荐 7 个开源的AI工具,您可以将它们添加或补充到自己的开发工作流程中,一定能提高速度与效率。 这些工具从简单的代码完成到成熟的应用程序构建器,应有尽有。 不用太正式,喝杯茶,随意探索这些项目,如果你喜欢这些项目的某一个,并请为在存储库前加注星标,来支持伙伴们。let‘s go! Keyword: Domo

9 Elements Of The Safe Operation Procedure Of Hydraulic Concrete

The Hydraulic Concrete Block Machine is a very common building material machine. The operating procedures are very important. The Hydraulic Concrete Block Machine Factory kindly reminds you that you must follow the following 9 elements during use:  1. When the hollow brick machine is running, it is strictly forbidden to put the tool into the…

“AI Agentic”:一文了解代理人工智能

什么是代理人工智能?这些“自主式”系统如何彻底改变行业?复杂任务的人工智能自动化如何提高生产力并促进更明智的决策?为什么我们现在需要了解这项尖端技术或者新的AI基础设施? 2024 年 5 月以来,“Agentic AI“与”代理人工智能” 一词开始在互联网上频频出现,这标志着人工智能话语权的重大转变。  这一概念将人工智能视为一个实体,即使仍不具备自主性,但至少具有决策能力,这一概念在学术界和工业界越来越多地出现了。  这不仅反映了最近的技术进步,也揭示了我们对人工智能及其潜力的理解发生了新的转变。  代理人工智能这一概念的提出,揭示了人机交互更有意思的问题,从而提出了关于人工智能的伦理影响与未来应用、以及它所带来的挑战与机遇等问题。 我们现在就来详细了解。 代理人工智能的定义 当我们谈论代理人工智能时,其实指的是一类目标实现自主操作的人工智能系统。这意味着,设计用于做出决策并与环境互动以实现特定的目标。为此,代理人工智能必须能够感知其环境,收集和处理数据,并执行操作以实现预定义目标。  与需要人工监督并遵循预定义规则的传统人工智能系统不同,代理人工智能有望动态地调整与优化其性能。 RPA 4.0 代理人工智能可以帮我们实现复杂工作流的自动化、提高生产率并实现更高效的决策流程,从而为行业带来新视角。从现实场合中,AI 代理可以部署到客户服务、医疗健康和金融等领域,用来管理任务。它们的总体目标是承担以前对人类来说耗时且耗资源的任务。  简而言之,这可能是机器人流程自动化的 4.0 版本。 代理人工智能主要功能可以分为几个领域: 感知:AI 代理通过传感器或数据输入从其环境中收集数据。这些数据可以包括与代理任务相关的视觉、文本、音频或其他形式的输入。 决策:基于收集的数据,AI 代理使用决策算法来分析情况并确定最佳行动方案。这涉及评估不同的选项并预测潜在结果,以选择最佳行动方案。 行动:在确定最佳行动方案后,AI 代理将采取必要步骤来实现其目标。这可能涉及与用户交互、控制物理设备或触发软件系统内的特定流程。 学习和适应:代理人工智能不断从经验中学习,并随着时间的推移提高其性能。这一学习过程使它们能够更有效地处理新的和意想不到的情况,从而提高其整体能力。 代理人工智能与传统人工智能系统的区别 代理人工智能在许多关键方面与传统人工智能系统有所不同,主要是在自主性和适应性方面。 自主性意味着传统的人工智能系统可能需要监督或人工干预才能执行任务。它们根据预定义的规则和脚本运行,这限制了它们适应新情况的能力。另一方面,代理人工智能却能够自主运行、做出决策,并在没有持续人工监督的情况下采取行动。这种自主性使它们能够更有效地管理复杂而动态的环境。 至于适应性,这与传统人工智能模型通常缺乏随时间学习和适应的能力形成对比。它们是为特定任务而设计的,难以应对超出其训练数据范围的场景。另一方面,代理人工智能使用机器学习技术不断从新数据和经验中学习。这种适应能力使它们能够提高性能并管理更广泛的任务。 代理人工智能还被设计成以更复杂的方式与环境和其他系统进行交互。它们可以与其他代理人工智能或人类用户协作,共享信息并共同努力实现共同目标。  这种程度的互动和协作通常超出了传统人工智能系统的能力。 最后,虽然传统 AI 系统遵循预定义的规则来做出决策,但 AI 代理使用高级算法来评估多种因素并预测结果。这种复杂的决策过程使 AI 代理能够更有效地管理细致入微、多方面的任务。 什么是代理人工智能? 代理人工智能(AI Agent)一共分为两大类:软件代理与嵌入式代理。 软件代理 这些代理在数字环境中运行,例如计算机或移动设备。它们通常用于虚拟助手、聊天机器人和自动客户服务系统等应用程序。软件代理通过界面与用户交互,并执行安排约会、回答问题、管理数据等任务。 嵌入式代理 这些代理嵌入物理之实体,例如机器人或自动驾驶汽车。嵌入式代理与物理世界交互并执行导航、对象操纵和环境感知等任务。示例包括制造业中的机器人助手、医疗保健机器人和自动驾驶汽车。 代理人工智能的基本原理和组成 代理人工智能的功能常规的例如感知和数据收集、决策过程、行动和反馈循环以及学习与适应。  AI 代理使用各种传感器和输入设备收集有关其环境的数据。这些数据对于了解代理运行的环境和做出明智的决策至关重要。 另一个部分与决策过程有关。根据收集的数据,代理人工智能使用决策算法来评估不同的选择并预测潜在结果。这些算法可以是简单的基于规则的系统,也可以是复杂的机器学习模型。 最后,行动和反馈循环完成了基本基础。一旦做出决定,代理人工智能就会执行实现其目标所需的行动。然后,他们监控这些行动的结果,并使用反馈来改进其未来的决策过程。这种持续的反馈循环使代理人工智能能够随着时间的推移提高其性能。…

StarCoder2 :ServiceNow、Hugging Face 和 NVIDIA 为开发者发布新的开放式 LLM

ServiceNow、Hugging Face 和 NVIDIA 联手发布了一个名为 StarCoder2 的新开放 LLM 系列,专为开发者设计。 以下网址所抓图,可以看到使用众多,技术专家,程序大牛们纷纷来测试使用。 官网地址:https://huggingface.co/bigcode StarCoder2 已经接受过 619 门编程语言训练,旨在为开发者提供代码生成、工作流生成和文本摘要等功能。 三家公司预计, StarCoder2 模型将对软件工程师、开发者以及普通公民都有很大的裨益。 StarCoder2 是在 BigCode 社区( bigcode-project.org)内开发的,该社区是一个致力于负责任地开发 LLM 的小组。该项目由 ServiceNow 和 Hugging Face 共同管理。 相比于上一代StarCoder模型,StarCoder2用30亿参数模型就实现了初版150亿参数模型的性能。 StarCoder 2 分别对应三种不同的模型尺寸: ServiceNow 训练了一个 30 亿个参数的模型; Hugging Face 训练了一个 70 亿个参数的模型; NVIDIA 训练了一个 150 亿个参数的模型。 较小的型号旨在提供强大的性能,同时使用少量的计算能力。30 亿参数模型与原始 StarCoder 版本的 150 亿参数模型的性能相匹配。 用户将能够使用 NVIDIA NeMo…

REST 与 GraphQL:面向开发者的 API 架构对比

API 简介 API(应用程序编程接口的综合与)是软件与Web开发的核心支柱,为应用程序与数据库或服务器无缝通信和共享数据创建桥梁或链接。 API 架构风格有很多,有这两种风格最为流行,分别是:REST(表述性状态传输)和 GraphQL。两者均有一些优点和缺点。 本文指南将向各位介绍这些 API 架构、它们的原理、优点、缺点和用例。读完本文后,你将获得一些真实见解,可以对项目中使用的 API 架构做出更明智的决策。 我们深入研究 REST 和 GraphQL,比较它们的优缺点之后,希望能帮助更多开发者朋友做出正确的选择。 了解 REST API REST是 REpresentational State Transfer 的缩写。 它是当今大多数服务器和网站上最常见的 API 架构风格。使用 REST 风格构建的 API 被称为 RESTful API。 RESTful API 将资源组织为统一资源标识符 (URI)。资源是 API 表示或与之交互的实体或对象。URI 区分服务器上的资源:它可以是用户资源、产品资源或图像资源,具体取决于你在后端服务器上构建的内容。 资源始终要以名词而不是动词分组。比如: example/com/api/v1/user 而不是下面的样式: example/com/api/v1/getauser 比如客户端想要从服务器检索用户详细信息,则客户端使用HTTP 代码向服务器发送针对用户资源的请求。 这里我们所讨论的资源就如同调用服务器上的用户数据表。 REST 的具体用例 Web服务: REST 被广泛用于构建提供功能的 Web 服务。常见的例子有支付网关、天气服务、公共 API 等。…

OpenAI发布原生多模式 GPT-4o:可读取文本、视觉效果和声音

OpenAI 在周一晚间展示了其最新的多模式机器学习模型 GPT-4o。 OpenAI 首席技术官 Mira Murati 在演示中如此说道: “今天的重大新闻,是我们即将推出新的旗舰型号,我们将其称为 GPT-4o。GPT-4o 的特别之处在于,它为每个人带来了 GPT-4 级别的智能,包括我们的免费用户。” 这家AI超级实验室还推出了适用于 macOS 的桌面应用程序(今天可供 Plus 用户使用,未来几周内可供其他用户使用),以及 ChatGPT 的 Web 用户界面更新。 正如很多人预言的那样,没有任何关于人工智能搜索引擎的消息。 关于 GPT-4o GPT-4o 中的“o”代表“omni”,指的是该模型接受视觉、音频与文本输入,并从用户的任何模式生成输出的能力。包括提示或请求,在视觉上,OpenAI 指的是视频与静态图片。 GPT4o 在处理英文和代码文本时与 GPT Turbo 一样快,可以在短短 232 毫秒内响应音频输入,“平均为 320 毫秒,这与人类对话中的响应时间相似。”响应时间的减少是因为与其他 ChatGPT 版本不同,所有输入和输出均由同一神经网络处理。 在以前的版本使用语音模式会出现延迟。这是由于 GPT-3.5 或 GPT-4 的语音管道涉及三种模型:一种用于转录,一种用于处理文本,一种用于将文本转换为音频。因此当数据在这些单独的模型之间流动时,会产生几秒钟的延迟。 GPT-4o将这些功能组合到一个模型中,因此它可以更快地响应,并且可以访问以前的版本无法在模型内传输中保存的信息,例如语气、多个扬声器和背景噪音。 但是出于安全考虑,并非该模型的所有功能都会立即可用。GPT-4o 的文本和图像功能可同时供免费版 ChatGPT 用户和付费 Plus 客户使用,他们的使用限额比以前高出 5 倍;团队和企业用户可以有更高的限额。 改进后的语音模式会在几周内进入 ChatGPT Plus…

OpenAI 宣布 ChatGPT 移动应用扩大覆盖范围,在更多国家上线

5月26日消息:OpenAI 在推特上宣布,官方版的 ChatGPT 移动应用现在在更多国家推出。当 OpenAI 上周首次推出移动应用时,该应用仅在美国的 iOS 上可用。现在,许多生活在欧洲、韩国、新西兰等地的人们都可以从 App Store 下载该应用。 ChatGPT 移动应用是一款免费应用,没有任何广告。对于已经熟悉 ChatGPT 的人来说,这只是与聊天机器人互动的一种方式,没有多余的功能。 以下是 ChatGPT 现在可用的国家/地区完整列表:阿尔巴尼亚、克罗地亚、法国、德国、爱尔兰、牙买加、新西兰、尼加拉瓜、尼日利亚、韩国、英国和美国。目前,该应用仅在 iOS 上可用。在最初的公告中,OpenAI 还承诺即将推出 Android 应用。 当你打开应用时,你可以在屏幕底部的文本框中输入文字。它的操作方式就像在任何聊天应用中发送消息一样。你可以使用苹果内置的语音识别功能来输入文本,也可以利用 OpenAI 的开源语音识别系统 Whisper 进行语音输入。 当你点击发送按钮后,OpenAI 会处理你的请求并返回一个由 AI 生成的回答。你可以进一步提供更多信息或要求不同的答案。该应用支持代码块,用户可以复制和粘贴回答。 默认情况下,ChatGPT 会保存你的聊天记录并将其用于模型训练。当启用此功能时,你也可以在桌面上找到你的对话记录。值得注意的是,如果不禁用聊天记录,就无法禁用数据共享。 如果你是 ChatGPT Plus 的订阅用户,你将能够通过移动应用访问 GPT-4 的功能。用户还应该注意到期响应时间更快。ChatGPT Plus 在桌面上每月收费 20 美元,也可以以本地货币在应用内订阅(在欧洲为每月 22.99 欧元,在英国为每月 19.99 英镑等)。 此外,OpenAI 悬赏 10 万美元,以推动 AI 健康发展。 根据路透社报道,OpenAI…

中国网络文学为何能收获越来越多海外读者

  从2011年起,“80后”网络文学作家袁野开始以笔名“爱潜水的乌贼”在网上发表小说。他的代表作被翻译成英语、泰语等多国语言,作品海外阅读量约5000万。   袁野的作品走红海外,不是孤立现象。近年来,越来越多中国网络文学作品扬帆出海,吸引大批海外读者订阅。   日前发布的《2023中国网络文学出海趋势报告》显示,2022年中国网络文学全行业海外营收规模达40.63亿元人民币,同比增长39.87%。   根据中国作协统计,截至2022年底,中国网络文学已累计向海外输出作品16000余部,覆盖200多个国家和地区,海外用户超过1.5亿人。   此外,《赘婿》《大国重工》等16部中国网文作品于2022年被收录至大英图书馆的中文馆藏书目中,中国网络文学在海外影响力提升显著。   为何这些中国网文小说不仅国内读者爱看,海外读者也频频“催更”,甚至有部分作品进入了欧美主流文化圈?   回望自己的学习和工作经历,袁野认为走上全职网文写作这条道路,源自一种“表达的冲动”。大学计算机专业毕业后,曾当过教科书编辑的袁野告诉记者,他从小读书很杂,既有古代武侠小说,也有海外科幻小说。   “不管是友情、爱情还是亲情,只要把情感很好表达出来,就能同样感动国外的读者。”他表示,优秀的网络文学作品吸纳融合了包括中国文化在内的东西方文化元素,具备跨文化特质和审美价值追求的作品才能打通人类共通的情感。   “青春热血的奋斗、守望相助的温暖……中国网络作家的成功,在于把‘我的故事’讲述成了‘我们的故事’。”浙江省作协党组书记叶彤这样解读中国网络文学为何能在海外持续“圈粉”。   专家认为,网络文学作品在海外传播面越来越广,海外读者对中国文化的了解和兴趣也正日益增强,随之形成的正向反馈,又有利于中国网文在海外的进一步传播。   北京作协副主席、网络作家张威(笔名:唐家三少)表示,网络文学构建的故事,常蕴含着中国上下五千年的优秀文化,海外读者阅读时,能身临其境感受中国文化,并产生进一步了解中国的想法。   “网文作品不仅融入众多中国元素,如神话传说、民风民俗等,更继承和发扬了中华民族优秀品格,这些积极的内容都能引发海外读者的共鸣。”创作过《芈月传》等多部“出圈”作品的浙江省网络作协副主席蒋胜男,对网络文学和中华文化结合也深有体会。   中国社会科学院文学研究所副研究员汤俏表示,网络文学受到海外读者喜爱,重要原因在于内容“好看”:一方面跌宕起伏的情节和脑洞大开的设定,为读者提供了缓解压力的休闲方式;另一方面,融入瓷器、刺绣、戏曲等东方文化元素,又增添了新鲜感“魅力光环”。   作为中华文化“走出去”的重要组成部分,网络文学除了好看的内容以外,一系列海外传播生态系统的逐步建立,为其稳定的输出提供了产业保障和技术支持。   据网络作家朱洪志(笔名:我吃西红柿)介绍,平台搭建对网络文学海外传播至关重要:首先要打造网文阅读和传播平台,让海外读者们有地方看小说;再者这些平台热度要高,日活用户足够多,集纳各种网文品类,带来较强的阅读黏性,吸引读者持续追更。   事实上,随着阅读逐步深入,海外读者已不满足于只看翻译本,而是开始主动创作。阅文、掌阅等企业积极搭建海外作者创作平台,已培养海外本土作者60余万,产出外语网文作品数十万部。此外,多家平台通过投资海外网站、文化传媒公司等方式,与外方形成战略合作关系。   同时,网络文学IP改编海外影响持续走高,创作本土化生态初步建立。从文本出海、IP出海到模式出海,网络文学将中国故事传播到世界各地,日益成为世界级文化现象。   借鉴国内的网文IP产业模式,海外原创网文也走上了IP开发的快车道,合作团队来自美国、英国、印度、日本等多个国家,例如网文改编有声书,单部作品最高播放量突破3000万,覆盖英语等多个语种;《龙王的不眠之夜》等多部作品已有英文、日文漫画改编,人气值最高破亿。   从最初的海外翻译出版授权,到联动各方共同进行内容培育和IP开发,中国网文的出海之路正不断进化,既是世界读懂中国的窗口,也成为中外文明互鉴的桥梁。 责任编辑:王风 Keyword: 中华文明