-
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低 50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。 在腾讯...
-
Llama中的曼巴:通过推测解码加速推理
大型语言模型(LLMs)已经彻底改变了自然语言处理领域,但在处理非常长的序列时面临重大挑战。主要问题来自于Transformer架构的计算复杂度随序列长度呈二次方增长以及其巨大的键值(KV)缓存需求。这些限制严重影响了模型的效率,特别是在推理过程中,使生成...
-
文心一言:探索AI写作的新境界
在人工智能飞速发展的今天,AI写作助手已经成为许多写作者、内容创作者和营销专家的重要工具。"文心一言"作为一个先进的AI写作平台,以其强大的语言理解和生成能力,为用户提供了从文本生成到编辑、优化等一系列服务。本文将介绍如何使用文心一言的各种指令,帮助你更高...
-
Llama 3模型:多维度损失函数铸就大语言模型新巅峰
在人工智能领域,大型语言模型(Large Language Models, LLMs 的发展如火如荼。作为这一领域的佼佼者,Llama系列模型一直备受关注。随着Llama 3的横空出世,其在模型架构、训练方法等方面的创新再次引发业界热议。本文将深入探讨Ll...
-
突发!OpenAI展示草莓,很快发布“GPT-5”猎户座!
OpenAI不藏了,终于展示江湖流传已久的秘密项目“草莓”(Strawberry)和猎户座(Orion 。 根据Theinformation消息,OpenAI已经向美国国家安全官员展示了草莓这个秘密项目,保证会在安全、合理的范围内来开发和使用。同时Open...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 Task02笔记
一.认识通义千问 通义千问是一款具有信息查询、语言理解、文本创作等多能力的AI助手。其中,编程与技术支持能力是它的强项之一。 我们可以利用通义千问帮助辅助分析代码结构和功能 二.精读baseline 文生图代码的框架结构: 可以看到,这段代码...
-
智能语音生成会议纪要的神器
嘿,技术爱好者们,今天我想分享一个令人兴奋的智能语音项目。它巧妙地结合了faster-whisper、Pyannote以及一系列先进的大语言模型,旨在为会议纪要的自动化生成带来新的可能。 开发了一个智能语音生成会议纪要的神器 在线体验:智能语音...
-
快速上手文心一言指令的实用指南
在当今这个信息快速发展的时代,人工智能技术已经深刻影响了我们的工作和生活。文心一言作为一款先进的自然语言处理工具,不仅可以帮助用户生成文本、回答问题,还能够广泛应用于教育、内容创作、客户服务等多个领域。掌握文心一言的指令使用方法,可以显著提高我们的工作...
-
探索Llama 3.1:深入理解其多语言与长上下文处理能力
摘要 Llama 3.1,一款先进的语言模型,以其庞大的参数量和卓越的性能而闻名。本文将分析Llama 3.1在不同规模版本中—405B、70B和8B—的多语言处理能力和长上下文理解能力,探讨其在人工智能领域的应用潜力。 引言 随着人工智能技术的飞速...
-
Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task02笔记
1 前言 本次是学习内容是Datawhale AI夏令营第四期-AIGC文生图方向的学习笔记。 2 AIGC简介 AIGC(Artificial Intelligence Generated Content)即人工智能...
-
Qwen2:通义千问倾力巨献,领航语言新纪元
一、介绍 Qwen2 是由阿里云通义千问团队研发的新一代大型语言模型系列,它在多个方面实现了技术的飞跃和性能的显著提升。以下是对 Qwen2 的详细介绍: GitHub - QwenLM/Qwen2: Qwen2 is the large langua...
-
开源模型应用落地-Meta-Llama-3.1-8B-Instruct与vllm-单机多卡-RTX 4090双卡(十四)
一、前言 在应对业务访问量级提升的过程中,我们通过从单机单卡部署升级到单机多卡部署的方式,成功实现了VLLM模型的性能提升。在此过程中,我们遇到了一些问题和挑战,现在我将深入剖析这些经验教训,希望能够帮助大家快速上手部署可投入生产运行的环境。...
-
AI多模态实战教程:面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理
一、项目简介 MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型(MLLMs),提供⾼质量的⽂本输出,已发布4个版本。 1.1 主要模型及特性 (1)MiniCPM-Llama3-V 2.5: 参数规模: 8B 性能: 超越...
-
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1,“新趋势已显而易见”...
克雷西 西风 发自 凹非寺量子位 | 公众号 QbitAI Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了—— Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩...
-
快速上手文心一言指令:解锁AI对话新纪元
快速上手文心一言指令 一、引言:文心一言的魅力所在 二、准备工作:了解文心一言平台 2.1 轻松注册,开启智能对话之旅 2.2 深度探索,掌握界面布局奥秘 2.2.1 输入框:智慧交流的起点 2.2.2 回复区:即时反馈的窗口 2.2.3...
-
微软 Azure AI 已上线 OpenAI 最快的新模型 GPT-4o mini
微软 Azure AI 发布博客文章宣布,OpenAI 最快的模型 GPT-4o mini 现已在 Azure AI 上线。该模型支持文本处理,并承诺未来将支持图像、音频和视频。 图片来自 微软 Azure AI GPT-4o mini 比 GPT-3....
-
AIGC是什么,与AI绘画有什么关系,一篇文章带你了解AI绘画的前世今生
在讲解AIGC和AI绘画之前,我们先看看什么是AI以及AI的历史。 AI历史发展轨迹 什么是人工智能 人工智能(Artificial intelligence,简称AI 亦称机器智能,指由人制造出来的机器所表现出来的智能。通常人工智能是指用普通计...
-
中国大模型市场和AIGC产品评测分析汇总(信息收集)-2024上
1. 引言 在过去的几年里,随着计算能力的增强和数据量的爆炸式增长,人工智能尤其是机器学习领域迎来了前所未有的发展。中国在这一领域也展现出了强大的竞争力。特别是在大模型(Large Models)市场,中国已经成为全球领先的参与者之一。这些大模型,...
-
每日AIGC最新进展(46):上海AI Lab发布多模态大模型InternLM-XComposer-2.5、阿里发布视频生成大模型EasyAnimate-V3、快手发布人像模型LivePortrait
Diffusion Models专栏文章汇总:入门与实战 InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input...
-
中国电信首款自主品牌AI手机终端—麦芒30 5G正式发布,让智能触手可及
2024年7月18日,“超续航、巨抗造、真臻彩” 麦芒史上最强手机——麦芒30 5G正式发布,新机延续了麦芒系列超能续航、可靠品质的强大基因,更在AI智慧、便捷体验、至臻大屏、美学设计等方面持续进阶,为用户带来科技与时尚兼具的绝妙体验。 作为中国电信首款自...
-
AIGC各个应用场景下的模型选择
需要注意的是,下述模型可以在不同任务和领域中灵活应用,它们的归属也会根据模型的设计和主要应用领域而有所变化,并不绝对。 自然语言处理模型 模型层中自然语言理解(Natural LanguageUnderstanding,NLU 和自然语言生成(N...
-
AIGC实用场景-ChatBI架构设计
1. ChatBI概述 1.1 定义与背景 ChatBI是一种新兴的商业智能(BI)系统,它通过自然语言处理(NLP)技术,使得用户能够通过聊天的方式与数据进行交互。这种系统背后的理念是简化数据分析的复杂性,让非技术用户也能轻松地获取和分析数据。...
-
麦当劳决定炒掉AI员工,用AI点餐这件事不靠谱
从游戏公司的画师到电销公司的客服,被AI影响到工作的人在2023年可谓是一茬接着一茬,甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上,AI技术的快速发展确实已经开始对人类社会造成影响,但过高估计当下AI的能力也大可不必,因为...
-
【人工智能】一文看懂 LLaMA 2:原理、模型与训练
LLaMA 2(Large Language Model for AI Modeling and Assistance)是近年来广受关注的大规模语言模型之一。它被广泛应用于自然语言处理(NLP)任务,如文本生成、机器翻译和问答系统。本文将深入介绍LLaMA...
-
近屿OJAC带你解读:AIGC核心知识点LLM
近年来,人工智能(AI)领域经历了令人瞩目的增长,尤其是自然语言处理(NLP)。你知道是什么推动了NLP领域的这种飞速发展吗?没错,那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式! 这些模型是如何工作的呢?它们为何如此流行?在本文中...
-
国内 10 款主流语言大模型综合能力测评 包括文心一言、Kimi、豆包
很多国产的语言大模型在语言运用能力方面表现出色,特别是在特殊的语境中。测评中的语言大模型包括了: 阿里的通义千问。其表现最为突出,被作者称为"吵架Top AI",不仅能生成尖锐、刻薄的回复,还能创造图像内容,展现了强大的多模态能力。 商汤的商量模型虽然...
-
AI大模型排排坐——通义千问、文心一言、讯飞大模型使用体验
目前,通义千问、文心一言和讯飞大模型是较为受欢迎的AI模型,它们在使用方面各有区别和优劣势。以下是笔者近期使用三个模型的一点浅见: 一、通义千问 优势: 丰富的知识库:通义千问拥有庞大的知识库,能够为用户提供广泛的信息支持。 高效的检索能力:...
-
对标GPT-4 Turbo!OpenAI断供后 科大讯飞星火API调用量大增
快科技7月8日消息,今年6月,OpenA宣布终止对中国提供API服务,有业内人士分析,这将打击部分借助OpenAI大模型套壳创业的公司。 日前,有投资者在互动平台向科大讯飞提问:OpenAI关停中国地区的API服务,讯飞火星有承接OpenAI国内用户的AP...
-
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
没等到GPT-4o,商汤先把《Her》给发布出来了! 就在刚刚,商汤直接在现场来了个炸裂的Live Show,话不多说,直接看效果: 不仅声音非常拟人(观众直呼好磁性),而且还是实时、随时可以打断的那种! 它宛如被安上了一对儿眼睛,可以做到精准无误的所见...
-
对标GPT-4 Turbo!科大讯飞刘庆峰:理性认识中美差距 绝不能盲目自信
快科技6月30日消息,科大讯飞最新发布的讯飞星火大模型V4.0,在多个关键能力上实现了对GPT-4 Turbo的超越。 在近日的发布会上,科大讯飞董事长刘庆峰宣布,星火V4.0在文本生成、语言理解、知识问答、逻辑推理和数学能力等方面均达到国际领先水平,在8...
-
国产大模型新高度!讯飞星火4.0发布:整体超越GPT-4 Turbo,8个国际权威测试集测评第一
国内大模型的能力,又来到了一个新高度! 6月27日,科大讯飞正式对外发布讯飞星火大模型V4.0,以及在医疗、教育、商业等多个领域的人工智能应用。 随着新版本的发布,讯飞星火V4.0七大核心能力全面升级,在8个国际主流测试集中排名第一,整体超越GPT-4Tu...
-
微软大模型phi-3速览-3.7B比llama-3 8B更好?
背景 模型发布者:Microsoft 模型发布时间:2024年4月23日 发布内容:介绍了phi-3系列语言模型,包括phi-3-mini、phi-3-small和phi-3-medium。 重点关注:整体性能可与 Mixtral 8x7B...
-
【AI】文心一言的使用分享
在数字化时代,人工智能(AI)技术的飞速发展正在改变我们的生活。文心一言,作为这一浪潮中的佼佼者,以其卓越的自然语言处理能力和广泛的应用场景,给我带来了前所未有的使用体验。在这篇分享中,我将详细阐述我对文心一言的使用体验、功能特点、应用场景以及未来展望。...
-
阿里Qwen2正式开源,性能全方位包围Llama-3 | 最新快讯
Qwen 系列会是众多大学实验室新的默认基础模型吗? 斯坦福团队套壳清华大模型的事件不断发酵后,中国模型在世界上开始得到了更多关注。不少人发现,原来中国已经有不少成熟的大模型正在赶超国外。 HuggingFace 平台和社区负责人 Omar San...
-
LLaMA 羊驼系大语言模型的前世今生
关于 LLaMA LLaMA是由Meta AI发布的大语言系列模型,完整的名字是Large Language Model Meta AI,直译:大语言模型元AI。Llama这个单词本身是指美洲大羊驼,所以社区也将这个系列的模型昵称为羊驼系模型。 Ll...
-
【AIGC调研系列】Qwen2与llama3对比的优势
Qwen2与Llama3的对比中,Qwen2展现出了多方面的优势。首先,从性能角度来看,Qwen2在多个基准测试中表现出色,尤其是在代码和数学能力上有显著提升[1][9]。此外,Qwen2还在自然语言理解、知识、多语言等多项能力上均显著超越了Llama3[...
-
近日“AIGC”产品新增一员——腾讯元宝
"AIGC" 它通常指的是“Artificial Intelligence Generated Content”,即人工智能生成的内容。 随着人工智能技术的快速发展,特别是自然语言处理(NLP)、深度学习、生成对抗网络(...
-
彻底淘汰旧手机!苹果AI仅支持两款iPhone
快科技6月11日消息,苹果在WWDC24开发者大会中宣布了iOS 18系统的重大更新,同时推出了其首个生成式AI大模型Apple Intelligence,中文名称为Apple智能。 Apple Intelligence的推出标志着苹果在AI领域的新突破,...
-
【AIGC调研系列】Phi-3 VS Llama3
2024-04-24日发布的Phi-3系列模型在多个方面展现出了对Llama-3的性能优势。首先,Phi-3-small(7B参数)在MMLU上的得分高于Llama-3-8B-Instruct模型,分别为75.3%和66%[1]。此外,具有3.8B参数的P...
-
AI助手对决:ChatGPT vs 文心一言
背景介绍 在当今人工智能技术飞速发展的时代,AI助手已经成为我们日常生活中不可或缺的一部分。而在众多AI助手中,ChatGPT和文心一言可以说是备受瞩目的两大代表,它们在智能回复、语言准确性、知识库丰富度等方面都有着自己的...
-
文心一言 vs GPT-4 ----全面横向比较
文心一言 (Wenxin Yiyan 和 GPT-4 是两个强大的人工智能语言模型,它们在处理自然语言方面表现出了出色的能力。但它们有一些关键的区别和优势。以下是它们的横向比较: 公司和平台: * 文心一言是由百度开发的中文语言模型,专...
-
AI可以生成手语手势视频了!SignLLM通过文字描述即可生成手语视频
SignLLM是一个创新的多语言手语模型,它具有通过文字描述生成手语视频的能力。这项技术对于听力障碍者来说是一个巨大的进步,因为它能够提供一种新的沟通方式。 以下是SignLLM的一些关键特点: 文本到手语视频的转换:SignLLM模型能够将输入的文本或...
-
OpenAI“杀疯了”,GPT–4o模型保姆级使用教程!一遍就会!
5月14日凌晨1点,OpenAI发布了名为GPT-4o 最新的大语言模型,再次引领了人工智能领域的又一创新浪潮,让整个行业都为之震动。 据OpenAI首席技术官穆里-穆拉提(Muri Murati)表示,GPT-4o是在继承GPT-4智能的基础上,对文本...
-
恒生电子首席科学家白硕:长文本和多模态是生成式AI落地金融的两大利器
嘉宾丨白硕 采访/撰稿丨张洁 编辑丨千山 出品 | 51CTO技术栈(微信号:blog51cto) 在千行百业中,金融业一贯是新技术的早期采用者。无论是在数字化水平,还是在关于产业AI化的探索上,都走在了前列。因此,金融业也被视为生成式AI应用落地的潜力...
-
微软让MoE长出多个头,大幅提升专家激活率
混合专家(MoE)是个好方法,支持着现在一些非常优秀的大模型,比如谷歌家的 Gemini 1.5 以及备受关注的 Mixtral 8x7B。 稀疏混合专家(SMoE)可在不显著增加训练和推理成本的前提下提升模型的能力。比如 Mixtral 8×7B 就是...
-
DeepSeek Chat:AI对话助手 - 使用教程与免费体验入口
DeepSeek Chat是什么? DeepSeek Chat,基于DeepSeek-V2 模型,是一款集成了 2 千亿参数量的MoE(Mixture of Experts)模型的AI技术产品。它在中文综合能力(AlignBench)和英文综合能力(MT-...
-
ChatGPT们的幕后先驱,斯坦福教授Manning的四十年NLP生涯
今年 1 月份,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,斯坦福大学语言学和计算机科学教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获奖。 曼宁教授是将深度学习应用于 NLP 领域的早期领军人物,在词向量 GloVe...
-
讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型
科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次将多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。 科大讯飞董事长刘庆峰在...
-
华为开发者大会定档 将发布盘古大模型5.0
华为开发者大会定于6月21日至23日在东莞松山湖盛大举行,届时将见证盘古大模型5.0与HarmonyOS NEXT鸿蒙星河版的首次同台展示。 盘古大模型系列,作为华为精心打造的一系列预训练大模型,涵盖了自然语言处理(NLP)、计算机视觉(CV 以及科学计算...
-
一文读懂 LLM 的构建模块:向量、令牌和嵌入
在当今信息爆炸的时代,我们不断面临着海量文本数据的挑战。为了有效地处理和理解这些数据,自然语言处理(NLP)领域的研究者们一直在不断探索和创新。而其中一个重要的研究方向就是语言模型(Language Model)。 在这篇文章中,我们将一起探索和理解...