-
Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3
最近,「小语言模型」忽然成为热点。 本周一,刚刚完成4.15亿美元融资的法国AI初创公司Mistral,发布了Mixtral 8x7B模型。 这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和GPT-3....
-
AI绘画 | stable-diffusion的模型简介和下载使用
前言 我们下载完stable-diffusion-ui后还需要下载需要的大模型,才能进行AI绘画的操作。秋叶的stable-diffusion-ui整合包内,包含了anything-v5-PrtRE.safetensors和Stable Diffusi...
-
【Google Bard】公测已开始,与文心一言、chatGPT相比如何?
一、Google Bard简介 自从2022年11月30日,openAI开放聊天机器人chatGPT之后,其热度一直居高不下。 openAI公司成立于2015年,成立后不久,微软就对其工作给予了大力支持,包括资金援助、以及提供高性能服务器。 在这些...
-
最强文生图跨模态大模型:Stable Diffusion
文章目录 一、概述 二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练 三、Stable Diffusion 发展 3.1 图形界面...
-
AIGC系列之:CLIP和OpenCLIP
目录 模型背景 CLIP模型介绍 相关资料 原理和方法 Image Encoder Text Encoder 对比学习 预训练 Zero Shot预测 优势和劣势 总结 OpenClip模型介绍 相关资料 原理 结果 用法...
-
在矩池云运行 Stable Diffusion web UI,使用v1.5模型和 ControlNet 插件
今天给大家介绍下如何在矩池云使用 Stable Diffusion web UI v1.5 模型和 Stable Diffusion ControlNet 插件。 租用机器 租用机器需要选择内存大于8G的机器,比如 A2000,不然 Stable D...
-
Stable Diffusion 绘画初探 chilloutmix模型 人物画像首选
AI绘画发展以来出现了很多优质的平台,Stable Diffusion是普通大众最爱的之一,比起MJ来讲,它是现在愿意动手的人的首选,在这里要首先感谢GITHUB上的一众开源大佬。 AI绘画首先吸引大家的不用说了,肯定是那些看起来美若天仙的小姐姐。无论二...
-
下一代自动驾驶系统,少不了大模型,系统调研来了
随着大语言模型 (LLM 和视觉基础模型 (VFM 的出现,受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里,LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力,但其在驾驶系统中的关键挑战...
-
论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models
论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 预训练Pretraining 3.1.1 预训练细节 3.1.2...
-
LLM - Chinese-Llama-2-7b 初体验
目录 一.引言 二.模型下载 三.快速测试 四.训练数据 五.总结 一.引言 自打 LLama-2 发布后就一直在等大佬们发布 LLama-2 的适配中文版,也是这几天蹲到了一版由 LinkSoul 发布的 Chinese-Llam...
-
UC伯克利DeepMind等联合发布真实世界模拟器,打破虚实边界
真实世界模拟器来啦! 还在发愁训练出的大模型无法适应真实的物理世界吗? AI Agent想要进入我们的生活还有多远的距离? ——UC伯克利、谷歌DeepMind、MIT和阿尔伯塔大学的研究人员告诉你答案。 在NeurlPS 2023上,研究人员将展示他们...
-
AIGC 场景下存储与数据管理的挑战与应对
10月28日,"寻宝 AI 时代——OSC 源创会苏州站暨 Techo TVP 技术沙龙"在苏州圆满落幕。腾讯云存储专家解决方案架构师屠伟新带来《AIGC 场景下存储与数据管理的挑战与应对》主题分享。下面我们一起来学习回顾一下AIGC场景下的存储解决方案。...
-
【文心一言】使用飞桨 AI Studio 快速搭建,看图识猜成语应用
目录 一、背景 二、实践 三、创建应用 3.1、零代码开发 3.2、应用名称 3.2、模型训练 3.3、开始训练 四、应用部署 4.1、发布项目 4.2、搜索应用 4.3、应用部署 4.4、获取令牌 4.4、导入依赖 4.5、配置CO...
-
Imagen2官网体验入口 谷歌AI文生图软件app免费下载地址
Imagen2 是Google DeepMind开发的最先进的文本到图像扩散技术产品,可生成高品质、逼真的图像,与用户的文字提示紧密对齐。这款技术利用其训练数据的自然分布生成更逼真的图像,而不是采用预设的风格。开发者和Cloud客户可以通过Google C...
-
真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
人工智能中的文本分类:技术突破与实战指导
在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。 关注TechLead,分享A...
-
谁能更好地检测深度伪造?人还是机器?
译者 | 陈峻 审校 | 重楼 不知您是否听说过深度伪造(Deepfakes)这种欺诈应用?由它产生的各种虚假信息已威胁到了人类社会的方方面面。随着人工智能技术的进步,我们亟待提升识别虚假内容的能力。那么在实际检测假新闻可信度等用例时,到底是人类还是机器...
-
人工智能改变牙科服务的六大趋势
难道已经有机器人牙医了吗?还没有……。但是,牙科诊所已经加快了将新兴技术融入常规诊疗的步伐。人工智能也不例外。事实上,人工智能正在显著改变牙科行业,牙科行业提供的一系列创新技术正在改善患者护理和提高诊断准确性及运营效率。我们已经看到了以下的六大趋势。...
-
如何训练一个简单的stable diffusion模型(附详细注释)
注:代码来自https://github.com/darcula1993/diffusion-models-class-CN/blob/main/unit1/01_introduction_to_diffusers_CN.ipynb 本文是本人学习后的...
-
QTNet:最新时序融合新方案!点云、图像、多模态检测器全适用(NeurIPS 2023)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 个人理解 时序融合能够有效提升自动驾驶3D目标检测的感知能力,然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章 《Qu...
-
What the DAAM: Interpreting Stable Diffusion Using Cross Attention
What the DAAM: Interpreting Stable Diffusion Using Cross Attention (Paper reading Raphael Tang, Comcast Applied AI, ACL2023 b...
-
扩散模型训练太难?来看看Meta AI最新提出的KNN-Diffusion
原文链接:https://www.techbeat.net/article-info?id=4323 作者:seven_ 最近AIGC社区中有趣的工作可谓是层出不穷,这都得益于扩散模型(Diffusion Models)的成功,扩散模型作为生成式AI...
-
谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!
提问:下面这张图,是AI生图还是照片? 如果不是这么问,绝大多数人大概都不会想到,这居然不是一张照片。 是的,只要在谷歌最新AI生图神器Imagen 2中输入这样的提示词—— A shot of a 32-year-old female, up an...
-
24 LLM错误代码补全:机器学习顶会NeurIPS‘23 智能体评估:自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】
Large Language Models of Code Fail at Completing Code with Potential Bugs 写在最前面 论文名片 对于命名实体识别、关系抽取任务的启发 课堂讨论 实验 自己构建的数据集...
-
LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界
斯坦福华人退学博士开发的Pika,让AI技术和艺术迸发出了绚丽的火花。 最近,又有斯坦福的华人研究人员提出的新的框架——WonderJourney, 可以用一句话或者一张图,自动生成一系列3D场景的连续画面,效果炫酷! 图片 用一张爱丽丝奇境漫游的图片,...
-
首个「创造式任务」基准来了!北大清华联手发布Creative Agents:专为想象力而生!
近年来,许多研究通过训练服从自然语言指令的智能体,让智能体具有了解决各种开放式任务的能力。 例如,SayCan[1]利用语言模型实现了根据语言描述解决各种室内机器人任务的智能体,Steve-1[2]训练端到端的策略实现了能够在《我的世界》(Minecra...
-
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。 近日,滑铁...
-
暴打GPT-3.5,谷歌Gemini大杀器官宣免费用!最强代码生成工具上线支持20+语言
谷歌年底开发者福利大放送来了! 谷歌Gemini发布一周之后,面向开发者的API也终于上线了。 目前,不管是Gemini Pro,还是Gemini Pro Vision,都可以免费体验。 虽然每分钟最多支持60次请求,但基本上可以满足大多数应用程序开发...
-
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作! 仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景: 只需输入一段古诗词,诗中场景立刻映入眼帘: 而且还是来回式的,可以再倒回去的那种: 同一起点可以进入不同场景: 真实场景也可以,其中的...
-
OpenAI 与出版巨头施普林格达成史无前例的协议,为 ChatGPT 提供新闻数据
12 月 14 日消息,新闻出版巨头施普林格出版集团(Axel Springer)与 ChatGPT 开发机构 OpenAI 宣布达成一项史无前例的协议,允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻...
-
OpenAI 和 Axel Springer 达成史无前例的协议,允许 ChatGPT 摘要其付费新闻内容
OpenAI 和全球新闻出版商 Axel Springer 周三宣布,双方达成了一项史无前例的协议,允许 ChatGPT 总结来自 Politico 和 Business Insider 等媒体的新闻报道。 这家德国媒体集团将因向美国人工智能公司提供内容...
-
Chinese-LLaMA-AIpaca 指令精调
文章目录 一、继续训练 Chinese-AIpaca 模型的 LoRA权重 二、基于中文Chinese-LLaMA训练全新的指令精调LoRA权重 1、合并 2、基于中文 Chinese-LLa...
-
邢波团队提出全开源倡议LLM360 让大模型实现真正的透明
开源模型在人工智能领域展现强大活力,但闭源策略限制了LLM(大型语言模型)的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节,为当前和未来的开源模型树立了透明度的样本。 论...
-
stable diffusion打造自己专属的LORA模型
通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自己的训练好的Lora模型放...
-
微软小模型击败大模型:27亿参数,手机就能跑
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。 今天,微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...
-
Hugging News #0814: Llama 2 学习资源大汇总
每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...
-
LLaMA-Factory使用V100微调ChatGLM2报错 RuntimeError: “addmm_impl_cpu_“ not implemented for ‘Half‘
微调命令 CUDA_VISIBLE_DEVICES=0 python /aaa/LLaMA-Factory/src/train_bash.py \ --stage sft \ --model_name_or_path /aaa/LLaMA...
-
面向 Stable Diffusion 的自动 Prompt 工程算法 BeautifulPrompt
近日,阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型,可以从简单的图片描述中生成高质量的提示词,从而使文生图模型能够生成更美观的图像。BeautifulP...
-
消息称 Meta 无视自家律师警告,使用盗版书籍训练 AI 模型
12 月 13 日消息,据路透社报道,根据一起版权侵权诉讼的新文件显示,Meta Platforms 在明知使用数千本盗版书籍训练其 AI 模型存在法律风险的情况下,仍然一意孤行。 据IT之家了解,该诉讼由喜剧演员 Sarah Silverman、普...
-
AI视野:Midjourney正式上线Alpha网页版;OpenAI恢复会员注册;腾讯发布视频生成模型AnimateZero;微软发布小语言模型AI Phi-2
???AI应用 Midjourney正式上线Alpha网页版!支持已生成图片设置参数回填 Midjourney Alpha全新升级,生成用户界面更便捷,成功生成1万张图片即可获得权限,可视化图像参数支持点击回填到提示词输入框,提升生成体验。 截图自归藏...
-
一张照片、一段声音秒生超逼真视频!南大等提出全新框架,口型动作精准还原
一段音频+一张照片,瞬间照片里的人就能开始讲话了。 生成的讲话动画不但口型和音频能够无缝对齐,面部表情和头部姿势都非常自然而且有表现力。 而且支持的图像风格也非常的多样,除了一般的照片,卡通图片,证件照等生成的效果都非常自然。 再加上多语言的支持,瞬间照...
-
美国联邦机构提出1200个AI用例,但只有少数得以实施
美国联邦机构看到在其日常工作中使用人工智能工具的许多可能性,但实际上只有其中一小部分被付诸实践。周二发布的一份报告显示,审计署发现20个非国防机构在政府中鉴定了超过1,200种用例,但它们只实施了其中约16%的人工智能用例。 例如,人事管理局正在利用人工智...
-
全方位、无死角的开源,邢波团队LLM360让大模型实现真正的透明
开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。」 专有模型在技术性能和创新能力上展现了非凡的力量,但是它们不开源的性质成为 LLM 发...
-
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
大模型现在真的是越来越卷了! 11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。 谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。 就在今天,微软正式发布了曾在11...
-
高效微调技术QLoRA实战,基于LLaMA-65B微调仅需48G显存,真香
目录 环境搭建 数据集准备 模型权重格式转换 模型微调 模型权重合并...
-
通义千问72B模型荣登大模型评测平台OpenCompass榜首
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。 OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的...
-
如何在Python中使用ChatGPT API处理实时数据
译者 | 李睿 审校 | 重楼 OpenAI公司推出的GPT如今已经成为全球最重要的人工智能工具,并精通基于其训练数据处理查询。但是,它不能回答未知话题的问题,例如: 2021年9月之后的近期事件 非公开文件 来自过去谈话的信息 当用户处...
-
首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性...
-
由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资
据彭博新闻报道,由两位谷歌资深人士创立的人工智能初创公司 Essential AI 已从隐秘状态中浮现,获得了 5650 万美元的新融资。 Essential AI 开发了一项名为「企业大脑」的技术,该技术可以利用 AI 执行企业职能,如数据分析,并自动...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...