-
【AI绘图 丨 Stable_diffusion 系列教程四】— Window 环境 | Stable Diffusion入门教程 及安装(全篇)
?腾小云导读 最近,AI图像生成引人注目,它能够根据文字描述生成精美图像,这极大地改变了人们的图像创作方式。Stable Diffusion作为一款高性能模型,它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小,是AI图像生成领域的里...
-
全面合作:传媒业巨头与OpenAI寻求共赢
12月13日,OpenAI与欧洲最大的数字出版公司施普林格Axel Springer宣布战略合作。这是继媒体联盟一再发起抵制AI厂商的抗议以来,首例传媒巨头与AI厂商从版权、技术及商业模式上的全方位战略合作。 本文梳理了此次合作带给新闻业的重要意义,与合作...
-
ChatGPT抢走了数据!编程语言排行榜,没法做了!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 提及编程语言排行榜,很多人都能想到Tiobe、RedMonk、Stack Overflow等,基本上它们更新的频率也相对固定。但最近,这家号称编程语言榜单天花板的RedMonk似...
-
Gemini Pro还不如GPT-3.5,CMU深入对比研究:保证公平透明可重复
谷歌Gemini实力到底如何?卡耐基梅隆大学来了场专业客观第三方比较。 为保证公平,所有模型使用相同的提示和生成参数,并且提供可重复的代码和完全透明的结果。 不会像谷歌官方发布会那样,用CoT@32对比5-shot了。 一句话结果:Gemini Pr...
-
研究发现,GPT 和其他 AI 模型无法分析 SEC 备案文件
一家名为 Patronus AI 的初创公司的研究人员发现,大型语言模型在分析美国证券交易委员会(SEC)备案文件时经常无法正确回答问题。即使是表现最佳的人工智能模型配置 OpenAI 的 GPT-4-Turbo,当给予几乎整个备案文件的阅读能力和相关问题...
-
关于num_steps_all = len(train_loader) // configs.gradient_accumulation_steps * configs.epochs的理解,文心一言
当然可以,我会尽量用简单的语言来解释这行代码。 这行代码计算的是在整个训练过程中,模型参数会更新的总次数。 len(train_loader :这表示你的训练数据被分成了多少份(或称为“批次”)。想象一下你有100张纸,每张纸上写了一些训练数据,那...
-
薅羊毛!阿里云免费GPU云主机畅玩AI绘画,免费领取阿里云v100显卡搭建AI绘画利器Stable Diffusion
❝ AI绘画利器Stable Diffusion,因为对电脑显卡,磁盘,内存等都有一些限制,导致大部分人望而止步,所以小编今天教大家免费领取阿里云的免费显卡服务器,免费试用3个月,以方便各位快速学习与使用。 ❞ 领取免费的GPU计算...
-
【小沐学Python】Python实现语音识别(Whisper)
文章目录 1、简介 1.1 whisper简介 1.2 whisper模型 2、安装 2.1 whisper 2.2 pytorch 2.3 ffmpeg 3、测试 3.1 命令测试 3.2 代码测试:识别声音文件 3.3 代码测试:...
-
摸底谷歌Gemini:CMU全面测评,Gemini Pro不敌GPT 3.5 Turbo
前段时间,谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra(能力最强)、Pro 和 Nano。研究团队公布的测试结果显示,Ultra 版本在许多任务中优于 GPT4,而 Pro 版本与 GPT-3...
-
CVPR 2023 | 可控文生图/定制化文生图领域论文详解 AI作画增强版
可控文生图/定制化文生图 1、DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation DreamBooth是一种新的文本到图像扩散模型...
-
斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置
斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序,可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置,其准确率令人印象深刻。 根据预印本论文的数据,PIGEON 可以以92%的准确率预测所拍摄国家,并且在40%的猜测中可以将位置定...
-
大语言模型训练数据常见的4种处理方法
本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者: 码上开花_Lancer。 大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023 年9 月为止,还...
-
实时湖仓技术选型,企业如何借实时湖仓赢在“数据驱动”时代
在之前三期的实时湖仓系列文章中,我们从业务侧、产品侧、应用侧等几个方向,为大家介绍了实时湖仓方方面面的内容,包括实时湖仓对于企业数字化布局的重要性以及如何进行实时湖仓的落地实践等。 本文将从纯技术的角度,为大家解析实时湖仓的存储原理以及生态选型,为企业建...
-
PillarNeSt:如何进一步提升基于Pillar的3D目标检测性能?
写在前面 && 笔者的个人理解 目前在自动驾驶领域中,一辆自驾汽车会配备多种传感器,如:激光雷达传感器采集点云数据、相机传感器采集图像数据等。由于激光雷达传感器可以更加准确的获取待检测物体的几何和位置信息,所以基于点云的感知算法模型在快速...
-
逆天!真实可控、可拓展,自动驾驶仿真平台LightSim上新
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
AIGC实战——条件生成对抗网络(Conditional Generative Adversarial Net, CGAN)
AIGC实战——条件生成对抗网络 0. 前言 1. CGAN架构 2. 模型训练 3. CGAN 分析 小结 系列链接 0. 前言 我们已经学习了如何构建生成对抗网络 (Generative Adversarial Net, GA...
-
每个开发人员都应该知道的六个生成式AI框架和工具
译者 | 晶颜 审校 | 重楼 在快速发展的技术领域,生成式人工智能是一股革命性的力量,它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界,揭示了对每个开发人员都必不可少的框架和工具。 LangChain LangChain由H...
-
数据治理与大模型一体化实践
降本增效方面,以机器学习团队的构成为例,滴普科技Deepexi产品线总裁柏海峰介绍道:“传统机器学习或者说小模型的技术落地,对人才的要求很高,但企业往往没有意识到这个问题。具体来说,一般需要构建一个综合性的团队即数据科学团队,团队中需要数据开发工程师、...
-
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
作为一位Java大师,我始终追求着技术的边界,最近我将目光聚焦在大数据领域。在这个充满机遇和挑战的领域中,我深入研究了Hadoop、HDFS、Hive和Spark等关键技术。本篇博客将从"是什么"、"为什么"和"怎么办"三个角度,系统地介绍这些技术。...
-
用生物脑机制启发持续学习,让智能系统适者生存,清华朱军等团队研究登Nature子刊封面
在开放、高动态和演化环境中的学习能力是生物智能的核心要素之一,也是人类以及大多数动物在「适者生存」的自然选择过程中形成的重要优势。目前传统机器学习范式是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因而无法适应动态开放环...
-
【网安AIGC专题10.11】①代码大模型的应用:检测、修复②其安全性研究:模型窃取攻击(API和网页接口) 数据窃取攻击 对抗攻击(用途:漏洞隐藏) 后门攻击(加触发器+标签翻转)
代码大模型的应用及其安全性研究 写在最前面 一些想法 大型模型输出格式不受控制的解决方法 大模型介绍 (很有意思)GPT 模型家族的发展 Chatgpt 优点 缺点 GPT4 其他模型 补充:self-instruct合成数据 Cod...
-
Gemini自曝文心一言牵出重大难题,全球陷入高质量数据荒?2024年或将枯竭
谷歌Gemini,又出丑闻了! 昨天上午,网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。 国外大模型用中国模型产生的中文语料训练,这听起来就是个段子,结果段子竟然成现实了,简直魔幻。 微博大V「阑夕」夜亲自下场,在Poe网站上实...
-
OpenAI官宣全新安全团队:模型危险分四级,董事会有权决定是否发布
今天,OpenAI连发多条推特,隆重宣布了自己的「准备框架」(Preparedness Framework)。 在经历了各种大大小小的风波之后,OpenAI终于把人工智能的安全问题摆到了台面上。 这套框架的目的,就是监控和管理越来越强的大模型。 防止哪天...
-
丹麦 AI 模型预测死亡率准确度超保险公司,引发被滥用担忧
12 月 19 日消息,丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型,可以根据个人数据预测死亡率,准确度远超现有的任何模型,甚至包括保险业使用的模型。研究人员表示,该模型能提前预警健康和社会问题,也需要警惕其被大型企业滥用。 乔...
-
大语言模型之四-LlaMA-2从模型到应用
最近开源大语言模型LlaMA-2火出圈,从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一,相比InstructGPT,LlaMA-2在数据质量、培训技术、能力...
-
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐
谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作,提出了一种名为PixelLLM的智能模型,旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发,尤其是婴儿描述其视觉环境的方式,包括手势、指向和命名。 Pix...
-
Hugging Face 首席执行官希望实现人工智能民主:将 AI 的力量集中在少数人手中是有风险的
Hugging Face 的首席执行官 Clément Delangue 对大型科技公司像商业专利一样保留机器学习代码的做法持反对态度。相反,他正在努力构建一个世界,在这个世界中,每个开发者或初创公司都可以自由访问人工智能模型,并有效地帮助 AI 实现开源...
-
AIGC参数量节节攀升,对存储带来的挑战如何解决?
引言 近期,AIGC 相关产品如同雨后春笋一般不断涌现。但在技术层面,大家普遍的关注点更多集中在性能方面,却经常忽略了存储对推理和训练效率的影响,以及 AIGC 内容可能带来的合规风险。我们特邀腾讯云存储的产品负责人 崔剑老师和益企研究院创始人、腾讯云 ...
-
华人团队用大模型实现“读心术”:大脑活动直接变文字
NeurIPS收录的一项新研究,让大模型也学会“读心术”了! 通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。 而且整个过程不需要大型设备,只要一块特制的“头巾”就能实现。 这项成果名为DeWave,能在不通过侵入式设备和MRI的情况下...
-
基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化
基于隐空间的扩散模型 (Latent Diffusion Model ,是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例,广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始,多次去...
-
word2vec作者曝与Ilya等十年积怨:seq2seq也是我的想法
里程碑式论文word2vec获得NeurIPS时间检验奖,可谓实至名归。 但一作Tomas Mikolov在Facebook上发表的长篇获奖感言,却充满了失望和不满。 图片 论文最初被ICLR拒稿都算小事了,他还暗讽了OpenAI首席科学家Ilya Su...
-
大语言模型微调数据竞赛,天翼云斩获冠军!
近日,天池FT-Data Ranker竞赛落下帷幕,天翼云智能边缘事业部AI团队(后称天翼云AI团队)凭借在大语言模型(LLM)训练数据增强方面的卓越研究,荣获大语言模型微调数据竞赛——7B模型赛道冠军。 FT-Data Ranker竞赛是一场面向大语...
-
华人团队用大模型实现“读心术”:大脑活动直接变文字 | NeurIPS 2023
NeurIPS收录的一项新研究,让大模型也学会“读心术”了! 通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。 而且整个过程不需要大型设备,只要一块特制的“头巾”就能实现。 这项成果名为DeWave,能在不通过侵入式设备和MRI的情况下解...
-
字节自研大模型,却因用ChatGPT被封号惹争议?官方回应了
上周末,有外媒报道称,字节跳动在使用 OpenAI 技术开发自有大语言模型时,因违反 OpenAI 服务条款从而遭账号禁用。 据 The Verge 报道,字节跳动内部正在研发的大语言模型项目名为「种子计划」(Project Seed)。 由于训练大模型...
-
大模型那么火,教你一键Modelarts玩转开源LlaMA(羊驼)大模型
图1.1 GPT-2 模型结构 关于训练集,其来源都是公开数据集,无任何定制数据集,保证了其工作与开源兼容和可复现。整个训练数据集在 token 化之后大约包含 1.4T 的 token。其中,LLaMA-65B 和 LLaMA-33B 是在 1.4万亿...
-
速度暴涨1000倍!扩散模型预测材料“炼金”过程,体系越复杂加速度越大
用扩散模型预测化学反应,速度直接暴涨1000倍! 原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。 这是MIT和康奈尔大学联合搞出来的一项新研究,用扩散模型来预测化学反应中最关键的过渡态结构,不仅计算速度提升1000倍,结果也竟然意想...
-
为AIGC敲响警钟!千亿级赛道为何成了作恶温床?
数据智能产业创新服务媒体 ——聚焦数智 · 改变商业 随着人工智能通用大模型的问世,全球对AIGC技术的强大潜力有了更加深刻的认识。然而,这也引发了诸多关于AIGC技术可信度、隐私保护以及知识产权等问题的争议,引起了广泛...
-
openAI灰度测试GPT4.5 实现六大能力增强
近日,有消息称OpenAI 正在灰度测试最新模型GPT4.5turbo,而宝玉、歸藏等博主也纷纷表示自己的版本已经更新到GPT4.5。 据GPT4.5turbo问答结果显示,相较于之前的GPT-4-turbo,新模型在多个方面实现了六大能力的增强。 首先,...
-
详解生成对抗网络(GAN)- 体验AI作画
目录 1.GAN是什么? 2.GAN的计算 3.编写GAN的小小示例 4.GAN的发展与应用 5.AI作画体验-Disco Diffusion 1.GAN是什么? 2014年,因为朋友邀请协助一个计算机生成图像的项目,lanGoodd...
-
MidJourney v5.2 、Stable Diffusion XL 0.9 出图对比
最近两个最流行的AI图像生成器,Midjourney和Stable Diffusion,都发布了重大更新。Midjourney v5.2引入了许多新功能,包括“缩小”功能、“/缩短”命令、改进的图像质量等。 Stable Diffusion XL (SD...
-
AIGC专题报告:ChatGPT纪要分享
今天分享的AIGC系列深度研究报告:《AIGC专题报告:ChatGPT纪要分享》。 (报告出品方:久谦中台) 报告共计:135页 OpenAI 高管解密 ChatGPT ¶ GPT-3 是一种大型语言模型,被训练用来在给定上下文中预测下...
-
基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化
? 宝子们可以戳 阅读原文 查看文中所有的外部链接哟! 基于隐空间的扩散模型 (Latent Diffusion Model ,是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例,广泛应用在商业和工...
-
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理
给你一首曲子的音频和一件乐器的 3D 模型,然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色,看它是钢琴曲还是小提琴曲又或是来自吉他;同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗? 实际上,...
-
源代码is all you need!7B代码小模型同尺寸无敌,性能媲美ChatGPT和谷歌Gemini
Hugging Face 技术负责人 Philipp Schmid 表示:“代码自动补全工具,如 GitHub Copilot,已被超过一百万开发者使用,帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...
-
【文生图】Stable Diffusion XL 1.0模型Full Fine-tuning指南(U-Net全参微调)
文章目录 前言 重要教程链接 以海报生成微调为例 总体流程 数据获取 POSTER-TEXT AutoPoster CGL-Dataset PKU PosterLayout PosterT80K Movie & TV Series...
-
Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3
最近,「小语言模型」忽然成为热点。 本周一,刚刚完成4.15亿美元融资的法国AI初创公司Mistral,发布了Mixtral 8x7B模型。 这个开源模型尽管尺寸不大,小到足以在一台内存100GB以上的电脑上运行,然而在某些基准测试中却能和GPT-3....
-
AI绘画 | stable-diffusion的模型简介和下载使用
前言 我们下载完stable-diffusion-ui后还需要下载需要的大模型,才能进行AI绘画的操作。秋叶的stable-diffusion-ui整合包内,包含了anything-v5-PrtRE.safetensors和Stable Diffusi...
-
【Google Bard】公测已开始,与文心一言、chatGPT相比如何?
一、Google Bard简介 自从2022年11月30日,openAI开放聊天机器人chatGPT之后,其热度一直居高不下。 openAI公司成立于2015年,成立后不久,微软就对其工作给予了大力支持,包括资金援助、以及提供高性能服务器。 在这些...
-
最强文生图跨模态大模型:Stable Diffusion
文章目录 一、概述 二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练 三、Stable Diffusion 发展 3.1 图形界面...
-
AIGC系列之:CLIP和OpenCLIP
目录 模型背景 CLIP模型介绍 相关资料 原理和方法 Image Encoder Text Encoder 对比学习 预训练 Zero Shot预测 优势和劣势 总结 OpenClip模型介绍 相关资料 原理 结果 用法...