-
苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达
一年一度的 Computex 科技大会成为了 GPU 厂商们秀肌肉的舞台,其中当属英伟达和 AMD 最为亮眼。英伟达现场拿出了量产版 Blackwell 芯片,还公布了未来三年的产品路线,包括下一代 Rubin AI 平台。 AMD 当然也不甘示弱,CE...
-
斯坦福回应抄袭清华系大模型:将撤下所有模型
近日,斯坦福大学AI研究团队的Llama3-V开源模型因抄袭指控被推上风口浪尖。该模型被指涉嫌抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5,这一事件迅速在网络上引发广泛关注和热议。 事件的起因在于,斯坦福AI...
-
被作者删库的Llama 3-V原文再现!效果匹敌GPT4-V,训练费用暴降,区区不到500 美元,尺寸小100 倍,如何做到的
编译 | 言征 作者 | Aksh Garg 备注:发稿前作者已经删掉原文 出品 | 51CTO技术栈(微信号:blog51cto) 近日,一款Llama3V最近被“先红后黑”的出了圈。作为全球顶尖研究学府的团队,身陷“抄袭”中国大模型的泥潭后,火速删稿...
-
快手、字节“妙鸭化”,AI图像应用还能再度出圈吗?
在文生图领域,快手也开大了。 据“头号AI玩家”了解,自研文生图大模型“可图”(Kolors)已于近日面向公众开放,用户可通过“可图大模型”微信小程序和网页版使用。 体验链接:https://kolors.kuaishou.com/ 小程序搜索:可图大模...
-
我用LLaMA大模型开发了一个聪明又温柔的智能客服机器人——她的名字叫“云云”
1、非常现实的问题 像绝大多数小型科技公司一样,作为一家中关村里的软件企业,我们的产品定位清晰、目标客户明确,在自己擅长的领域持续研发和耕耘,拥有了一定规模的用户群。 在公司发展的近10年时间里,我和我的同事共接待了近万名客户,这些客户有的购买了我们的...
-
文心一言指令详解及实例分析
一、引言 文心一言,作为人工智能领域的杰出代表,以其独特的自然语言处理能力和广泛的应用场景,受到了广泛的关注。 文心一言指令,作为其核心功能之一,允许用户通过自然语言与文心一言进行交互,实现信息的查询、生成、理解和推理。 本文将详细介绍文心一言指...
-
什么是LLM大模型训练,详解Transformer结构模型
本文分享自华为云社区《LLM 大模型学习必知必会系列(四 :LLM训练理论篇以及Transformer结构模型详解》,作者:汀丶。 1.模型/训练/推理知识介绍 深度学习领域所谓的“模型”,是一个复杂的数学公式构成的计算步骤。为了便于理解,我们以一...
-
Stable Diffusion 安装教程(附安装包) 【SD三种安装方式,Win+Mac一篇文章讲明白】
“Stable Diffusion的门槛过高、不会安装?没关系,这篇文章教会你如何安装!”(文末扫码可直接获取免费安装包~) Stable Diffusion的安装部署其实并不困难,只需简单点击几下,几分钟就能安装好,不管是windows还是苹果mac电...
-
AI日报:AMD向英伟达亮剑推出最强AI芯片;斯坦福AI团队承认抄袭国产大模型;suno将推“哼歌”功能;昆仑万维开源2千亿稀疏大模型天工MoE
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、挑战英伟达!AMD亮出旗下最强...
-
多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键
只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策! 这种方法得到的模型,已经学会了看图玩扑克、算“12点”等任务,表现甚至超越了GPT-4v。 图片 这是来自UC伯克利等高校最新提出的微调方法,研究阵容也是相当豪华: 图灵奖三巨头之一、M...
-
训练Stable Diffusion(XL) Lora的图片是否需要caption?
intro 目前很多风格lora模型的训练都会对图片进行caption,训练风格lora时使用image caption步骤是否能带来正向的效果? 在sdxl的代码实现中,lora插入的位置为unet中cross attention的QKV的线性投影部...
-
Ilya离开后,8位OpenAI新安全与保密委员会领军人物,你认识几位?
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI宣布成立新的安全与保密委员会,该委员会负责OpenAI项目和运营中的关键决策制定,这引发了互联网的广泛讨论,因为CEO山姆·阿尔特曼(Sam Altman)也是委员会成...
-
LeCun新作:分层世界模型,数据驱动的人型机器人控制
有了大模型作为智能上的加持,人型机器人已然成为新的风口。 科幻电影中「安能辨我不是人」的机器人似乎已经越来越近了。 不过,要想像人类一样思考和行动,对于机器人,特别是人型机器人来说,仍是个艰巨的工程问题。 就拿简单的学走路来说,利用强化学习来训练可能会演...
-
AI如何帮助提取图片中的颜色代码?AI提取图片代码的步骤是什么?
什么是 AI提取图片代码? AI提取图片代码是指使用人工智能技术,特别是图像处理和机器学习算法,来自动识别和提取图片中的颜色信息,将其转换为可用的颜色代码,如RGB或十六进制代码。 AI提取图片代码的核心功能 1:自动颜色识别,AI能够识别图片中的主要...
-
ChatGPT4o被越狱了,有人拿来搞大尺度!
你好啊,我是轩辕。 大家知道,为了防止AI被用于不法用途,各家的AI大模型都设置了一些安全防护措施。 当你尝试让AI去做一些可能涉及到违法的事情时,它会直接拒绝。 图片 然鹅,信息技术的发展总伴随着安全攻防对抗的产生,AI也不例外。 这不,现在就有这么一...
-
OpenAI衍生公司人工智能模型 让机器人像人一样思考、学习
OpenAI曾于2021年夏天宣布解散其机器人团队,原因是缺乏足够的数据来训练机器人使用人工智能进行移动和推理。但三位来自OpenAI的早期研究科学家创立的初创公司Covariant,声称已经解决了这一难题。 Covariant AI系统的特点: 结合...
-
这款AI产品为你提供一个游戏搭子,用Agent的方式在《我的世界》挖钻石
AI will completely reshape how games are played and made. The future is one where game creation is democratized, and makers are...
-
AmbientGPT有哪些功能免费吗?怎么使用方法详细教程指南
AmbientGPT 是什么? AmbientGPT是一个革命性的编程辅助工具,允许开发者在本地运行GPT- 4 和基础模型,同时能够直接推断屏幕上下文,从而无需手动上传上下文信息,大大提高了代码编写和问题解决的效率。 AmbientGPT 有哪些功...
-
AI让网友“吃石头”闹得沸沸扬扬,谷歌副总裁发博回应:不是幻觉
最近一周,网上关于谷歌AI overview(AI概览)的讨论沸沸扬扬,简直快要扛起X平台科技区的流量大旗。 这款在2023年5月就推出测试版的AI搜索,在正式上线前已处理了超十亿次查询,却依旧没能逃过翻车的命运,原因是它仍无法判断“人能不能吃石头、喝胶水...
-
[AIGC] redis 持久化相关的几道面试题
文章目录 1. 什么是Redis持久化? 2. Redis 的持久化机制是什么?各自的优缺点? 2.1 RDB(Redis DataBase),快照 2.2 AOF(Append Only File),日志 3. 优缺点是什么? 4. 如何...
-
大语言模型原理与工程实践:LLaMA 系列
1. 背景介绍 1.1 大型语言模型的兴起 近年来,随着深度学习技术的飞速发展,大型语言模型(LLM)逐渐成为人工智能领域的研究热点。LLM 是一种基于深度学习的自然语言处理模型,能够学习大量的文本数据,并根据这些数据生成自然流畅的文本、回答问题、进行...
-
2024最新GPT4.0使用教程,AI绘画,一站式解决
一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结+DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以...
-
实战经验分享之移动云快速部署Stable Diffusion SDXL 1.0
本文目录 前言 产品优势 部署环境准备 模型安装 测试运行 前言 移动云是中国移动面向政府、企业和公众的新型资源服务。 客户以购买服务的方式,通过网络快速获取虚 拟计算机、存储、网络等基础设施服务;软件开发工具、运行环境、数据库等...
-
Stable Diffusion高级教程 - 图生图(img2img)模式
前言 现在终于可以介绍 Stable Diffusion 除了文生图 (txt2img 之外最重要的功能:图生图 (img2img 。顾名思义,除了根据正向和反向提示词之外,还需要基于一张图片生成图。这个模式下功能很多我们挨个说 img2img 图...
-
工业知识图谱进阶实战
一、背景简介 首先来介绍一下云问科技的发展历程。 云问科技公司由 Chatbot 起家,在 2013 年到 2019 年间一直投身于 Chatbot 领域,主要关注人机对话方向,推出了很多客服类产品。后转型去做知识相关领域的原因是,在 Bert 发布之...
-
Lobe UI - 基于 AntDesign 开发的 AIGC Web 应用的开源 UI 组件库
今天推荐一个可以快速开发 ChatGPT UI 界面的组件库,质量很高,拿来就能用。 Lobe UI 是由 lobehub 团队开发的一套 web UI 组件库,和我之前推荐的很多通用型的 UI 组件库不同,Lobe UI 是专门为目前火热的 AIGC...
-
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mix...
-
LMDeploy高效部署Llama-3-8B,1.8倍vLLM推理效率
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,LMDeploy 对 Llama 3 部署进行了光速支持,同时对 LMDeploy 推理 Llama 3 进行了测试,在公平比较的条件下推理效率是 vLLM 的 1.8 倍。 书生...
-
Midjourney新功能:角色参照指南
基本概念 角色参照(Character Reference):这个功能允许用户在不同的图像生成中保持给定参照角色的一致性。 适用模型:适用于Midjourney V6和Niji6型号。 功能亮点 跨风格一致性:可以在不同风格(如动漫风、写实...
-
Llama-Factory 简介 二, 脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl
examples/ ├── lora_single_gpu/ │ ├── pretrain.sh: 基于 LoRA 进行增量预训练 │ ├── sft.sh: 基于 LoRA 进行指令监督微调 │ ├── reward.sh: 基于 LoRA...
-
Stable Diffusion 绘画入门教程(webui)-ControlNet(姿态预处理器openpose)
本片文章接着上篇文章ControlNet介绍他的控制类型,本篇介绍的预处理器为openpose 预处理器:openpose 模型:control_v11p_sd15_openpose 没下载模型的看上篇文章去下载一下哦,不然用不了...
-
开发arXiv论文引擎机器人程序:基于RAG+LangChain+Chainlit+ChromaDB
译者 | 朱先忠 审校 | 重楼 简介 在本文中,我将演示如何使用检索增强生成(RAG 技术构建语义研究论文引擎。具体地说,我将使用LangChain(https://www.langchain.com/ 作为构建语义引擎的主要框架,以及OpenAI公...
-
Stable Diffusion【进阶篇】:模特换装之图生图实现
文章使用的AI绘画SD整合包、各种模型插件、提示词、AI人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。 真人换装是图生图的一个典型应用。在图生图中可以通过局部重绘和涂鸦重绘两种方式实现,2种实现方式都差不多,不同的在于涂鸦重绘...
-
腾讯元宝全面测评!国产AI“看剧”时代开启!读懂《庆余年》范闲,揭秘奥特曼宫斗!打通腾讯生态“全村的希望”!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 腾讯在大模型上的动作姗姗来迟。 对于“后发”的抉择,腾讯想得很清楚。 在“腾讯元宝”上线的发布会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏说,“虽然行业内看起来火热,但是中国移动...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
首先,先跟各位小伙伴说一句 Sorry 。上一篇文章《【AIGC】本地部署通义千问 1.5 (PyTorch 》并没有考虑企业成本问题,虽然代码可以跑通,但是中小型企业想通过该代码实现项目落地还是比较困难的。为此,本文将采用 GGUF 预量化大模型结合 O...
-
利用人工智能和机器人推动科学发展
人类研究人员将永远在科学中发挥作用,但人类在探索科学方面有许多局限,我们需要吃饭和睡觉,我们的情绪会影响行为,我们的身体很容易受到不可挽回的伤害——所有这些都可能阻碍科学成就。美国阿贡国家实验室最近的发展表明,应该让机器人做一些工作,研究人员称之为“自主...
-
沙特阿美投资中国AI初创企业智谱AI 估值达30亿美元
据国外媒体报道,沙特阿拉伯国有石油集团沙特阿美的风险投资部门Prosperity7近日参与了中国生成式人工智能初创企业智谱AI的新一轮融资,投资金额约为4亿美元,使得智谱AI的估值达到了约30亿美元。 图源备注:图片由AI生成,图片授权服务商Midjou...
-
7B?13B?175B?解读大模型的参数
大模型也是有大有小的,它们的大小靠参数数量来度量。GPT-3就有1750亿个参数,而Grok-1更是不得了,有3140亿个参数。当然,也有像Llama这样身材苗条一点的,参数数量在70亿到700亿之间。 这里说的70B可不是指训练数据的数量,而是指模型中...
-
抖音:将打击使用AI技术P图侮辱他人等行为
抖音发布《重点打击泄露隐私、P图公开辱骂等网络暴力言论的公告》称,2024年至今,抖音共发现并处置网暴舆情162件拦截超过5000万条评论信息,发文警示、教育施暴者近70万个。 抖音表示,抖音一直致力于打造健康向上、风清气正的社区氛围,严厉打击实施或教唆、...
-
麦肯锡调查显示:生成式AI应用大中华区增长最快
据全球顶级咨询公司麦肯锡(McKinsey & Company)发布的最新调查报告《he state of AI in early2024:Gen AI adoption spikes and starts to generate value》,显...
-
超越Devin!姚班带队,他们创大模型编程新世界纪录
超越Devin!SWEBench排行榜上迎来了新玩家—— StarShip CodeGen Agent,姚班带队初创公司OpenCSG出品,以23.67%的成绩获得全球第二名的成绩。 同时创造了非GPT-4o基模的最高纪录(SOTA)。 我们都知道,SW...
-
Stability AI开源SD 3:6月12日可下载 不可商用
Stability AI 的联合首席执行官正式宣布了 Stable Diffusion 3 Medium 的开放发布日期为6月12日。这一消息让许多期待使用这一模型的人欣喜不已。 Stable Diffusion3Medium 是Stability AI...
-
我的stable-diffusion入门
开头 翻到一个感兴趣的帖子,然后开始了这段折腾 载下来用了,发现用的是cpu出图,慢的很,还是需要stable diffusion webui来做,所以就开始找资料 参考链接 找模型:https://civitai.com/https://hug...
-
英伟达发布数字人AI技术NVIDIA ACE 提升角色互动体验
NVIDIA最近推出了一种名为Avatar Cloud Engine (ACE)的先进数字人AI技术,旨在提升游戏和虚拟世界中角色的互动体验。 以下是NVIDIA ACE技术的关键特点: 智能对话能力:ACE技术能够让游戏中的NPC拥有真实的对话能力,...
-
知识图谱检索增强的GraphRAG(基于Neo4j代码实现)
图检索增强生成(Graph RAG)正逐渐流行起来,成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性,将数据以节点和关系的形式组织起来,从而增强检索信息的深度和上下文关联性。图在表示和存储多样化且相互关联的信息方面具有天然优势,能够轻松捕...
-
中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等
全国网络安全标准化技术委员会在官网发布了,国家标准《网络安全技术 生成式人工智能服务安全基本要求》征求意见稿。 该意见稿一共分为《网络安全技术 生成式人工智能服务安全基本要求-标准文本》、意见汇总处理表和编制说明三大块。 其中,标准文本涵盖训练数据安全要求...
-
Nvidia发布GeForce RTX增强版,为AI PC数字助手提供支持
Nvidia 在Computex 展会上推出了新的 RTX 技术,为新的 GeForce RTX AI 笔记本电脑提供动力。其中,Project G-Assist 技术演示为 PC 游戏和应用提供上下文感知的帮助。这项技术首次在 Studio Wildca...
-
大模型“分区”部署在云和边缘更合适?
作者 | David Linthicum 出品 | 51CTO技术栈(微信号:blog51cto) 众所周知,大型语言模型(LLMs)需要大量的计算资源。这意味着开发和部署主要集中在强大的集中式系统上,如公共云提供商。然而,尽管许多人认为我们需要大量的...
-
使用 Springboot3.x 实现考试系统中接打电话的识别与处理
本专题将深入探讨考试系统中常见的复杂技术问题,并提供基于Spring Boot 3.x的解决方案。涵盖屏幕切换检测与防护、接打电话识别处理、行为监控摄像头使用、网络不稳定应对等,每篇文章详细剖析问题并提供实际案例与代码示例,帮助开发者应对挑战,提升考试系...
-
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。 能够同时生成多种模态输出的多模态模型一般是通过某...