-
4万亿晶体管5nm制程,全球最快AI芯片碾压H100!单机可训24万亿参数LLM,Llama 70B一天搞定
全球最快、最强的AI芯片面世,让整个行业瞬间惊掉了下巴! 就在刚刚,AI芯片初创公司Cerebras重磅发布了「第三代晶圆级引擎」(WSE-3)。 性能上,WSE-3是上一代WSE-2的两倍,且功耗依旧保持不变。 90万个AI核心,44GB的片上SRA...
-
超强!深度学习Top10算法!
自2006年深度学习概念被提出以来,20年快过去了,深度学习作为人工智能领域的一场革命,已经催生了许多具有影响力的算法。那么,你所认为深度学习的top10算法有哪些呢? 以下是花哥我心目中的深度学习top10算法,它们在创新性、应用价值和影响力方面都具...
-
房价预测模型代码笔记以及文心一言Q.A记录
导入库方面略过不提 第一部分:简易日期处理模块 def processdate(date : date_num = (int(date[:4] - 2014 *12 + (int(date[4:6] -5 return date_n...
-
如何使用Nightshade保护艺术品免受生成式AI的侵害
译者 | 陈峻 审校 | 重楼 如您所见,当前正在发生的这场人工智能(AI)革命已经席卷了各行各业。其中给人最直观的感受便是,在基于交互式人机对话的基础上,AI算法不但可以生成类似人类语言的文本,而且能够根据一个(组)单词创建图像和视频。不过,这些人工智...
-
蚂蚁金服异常检测和归因诊断分析实践
一、归因诊断 在实际工作中,我们常常受到业务方对关键绩效指标(KPI)的灵魂拷问:某个 KPI 指标为什么会上升或下降?归因诊断的任务就是解释这些指标变化的原因。 归因诊断把问题的定位过程看作是一个因子对比的过程:指标在基准时间区间的值为 y,...
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为...
-
近屿智能完成A轮融资,打造行业领先的AIGC工程师与产品经理成长蓝图
2024年1月,上海近屿智能科技有限公司(简称近屿智能)成功完成了A轮融资,智望资本担任了领投角色,而金沙江创投也进行了追加投资。这一融资里程碑充分证明了近屿智能在AIGC行业的技术领先地位得到了市场的广泛认可和投资人的青睐。 自创立伊始,近屿智能始...
-
云知声旗下蓝藻AI服务升级 推出 AI 声音克隆等功能
云知声 AIGC 内容创作平台蓝藻 AI 近日进行全新升级,重点关注 AI 声音克隆和 AI 配音两大核心功能。 声音克隆是蓝藻 AI 的核心功能之一,用户可以通过声音克隆在线复刻自己的声音,快速、简单、低成本地创建个性化音频。只需提供少量用户原始录音,就...
-
PyTorch 该怎么学?太简单了
挺多小伙伴问过PyTorch该怎么学,经过长期实践来看,初学者需要熟知的概念和用法真的不多,以下总结的简明指南一起看看吧! 构建Tensor PyTorch 中的 Tensors 是多维数组,类似于 NumPy 的 ndarrays,但可以在 GPU...
-
Midjourney封禁Stability AI 禁止后者员工使用软件
Midjourney封禁Stability AI引发了一场关于数据安全和道德责任的争议。事件起因于Stability AI的数据收集工程师对Midjourney服务器发起了恶意攻击,导致其服务中断24小时。尽管Stability AI CEO Emad声称...
-
AI加速引擎PAI-TorchAcc:OLMo训练加速最佳实践
作者:黄奕桐、沈雯婷、艾宝乐、王昂、李永 摘要 阿里云机器学习平台PAI开发的Pytorch训练加速框架PAI-TorchAcc已接入最新开源的大语言模型 OLMo。 在保证模型效果和易用性的前提下,PAI-TorchAcc相对 PyTorch 性能在...
-
近屿智能完成A轮融资,独家打造的AIGC工程师与产品经理学习路径图成行业焦点
2024年1月,上海近屿智能科技有限公司(以下简称近屿智能)宣布成功完成A轮融资,由智望资本领投,金沙江创投追加投资。这一重大融资事件不仅象征着近屿智能在AIGC领域的领先地位得到了市场的广泛认可,更凸显了投资人对近屿智能技术实力与未来发展潜力的坚定信心。...
-
向英伟达发起挑战的Groq是什么来头?简单科普新型AI芯片LPU
在如今的人工智能领域,「GPU is All You Need」已经逐渐成为共识。没有充足的 GPU,连 OpenAI 都不能轻易升级 ChatGPT。 不过最近,GPU 的地位也在经受挑战:一家名为 Groq 的初创公司开发出了一种新的 AI 处理器...
-
一文总结扩散模型(Diffusion Model)在时间序列中的应用
扩散模型是目前生成式AI中的最核心模块,在Sora、DALL-E、Imagen等生成式AI大模型中都取得了广泛的应用。与此同时,扩散模型也被越来越多的应用到了时间序列中。这篇文章给大家介绍了扩散模型的基本思路,以及几篇扩散模型用于时间序列的典型工作,带你...
-
实战解析:打造风控特征变量平台,赋能数据驱动决策
金融业务产品授信准入、交易营销等环节存在广泛的风控诉求,随着业务种类增多,传统的专家规则、评分卡模型难以应付日趋复杂的风控场景。 在传统风控以专家规则系统为主流应用的语境下,规则模型的入参习惯被称为“变量”。基于专家规则的风险评估,存在规则触发阈值难量化...
-
十大必知的人工智能算法
随着人工智能技术(AI)的日益普及,各种算法在推动这一领域的发展中发挥着关键作用。从预测房价的线性回归到自动驾驶汽车的神经网络,这些算法在背后默默支撑着无数应用的运行。 今天,我们将带您一览这些热门的人工智能算法(线性回归、逻辑回归、决策树、朴素贝叶斯...
-
每日一看大模型新闻(2023.12.28)发现GPT-4 API存在重大漏洞;告别冷启动,LoRA为大模型提速高达300%;发布中文大模型基准测评年度报告;腾讯云AI绘画首批通过AIGC绘画平台评估
1.产品发布 1.1微软:明年春季推出首款AI PC 发布日期:2023.12.28 Microsoft’s next Surface laptops will reportedly be its first true ‘AI PCs’ - The...
-
清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!
自从大模型火爆出圈以后,人们对压缩大模型的愿望从未消减。这是因为,虽然大模型在很多方面表现出优秀的能力,但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」 通过把大模型的参数转化为低位宽的表示,进而节省空间占用。目...
-
一文搞懂:AI、机器学习与深度学习的联系与区别
在当今科技日新月异的浪潮中,人工智能(Artificial Intelligence, AI)、机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)如同璀璨星辰,引领着信息技术的新浪潮。这三个词汇频繁出现在...
-
近屿智能独家发布:AIGC大模型工程师和产品经理详细学习路径图(附完整版学习路径图)
AI不会取代你的工作,会取代你的是懂AI的人,如何提升自己与他人的知识壁垒,如何学习AIGC?相信在刚刚过去2023这个AI爆发的元年,我相信也是很多人的疑问,好像不懂使用点AI工具,例如ChatGpt、Midjourney或者SD,就好像被淘汰了一样,更...
-
【文生视频】Diffusion Transformer:OpenAI Sora 原理、Stable Diffusion 3 同源技术
文生视频 Diffusion Transformer:Sora 核心架构、Stable Diffusion 3 同源技术 Sora 网络结构 提出背景 输入输出 生成流程 变换器的引入 Diffusion Transformer (DiT...
-
Stable diffusion不同模型变量的work pipeline:checkpoint、lora、vae等等到底是怎么work together的?
SD里面有很多不同种类的模型参数,比如embedding、vae、checkpoint、hypernetwork、controlNet、clip还有lora,我看了很多博客,发现它们都是言语寥寥几句说什么改变风格,用于调整和改善生成图片的色彩之类的有点废话...
-
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练。 值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。 论文地址:https://arxiv.org/abs/2402.1681...
-
理解Stable Diffusion、LoRA、Dreambooth、Hypernetworks、Textual Inversion、Checkpoint
前言 在深度学习和人工智能的领域中,模型生成和调整技术的快速发展为创造性内容的自动化提供了新的可能性。本文将介绍四种重要的模型技术——Stable Diffusion、LoRA、Dreambooth、和Hypernetworks——它...
-
OpenAI和微软被The Intercept等三家新闻机构起诉,指控侵犯版权
《The Intercept》,《Raw Story》和《AlterNet》三家新闻机构在纽约南区分别提起诉讼,指控OpenAI和Microsoft存在侵权行为,包括在培训AI模型时删除作者、标题和其他版权信息。这三起案件均由同一律师事务所代理。 这些媒体...
-
解说 AIGC(人工智能生成内容) 是什么?
前言 AIGC (AI Generated Content 即人工智能生成内容,一般认为是相对于PCG(专业生成内容 、UCG(用户生成内容 而提出的概念。AIGC狭义概念是利用AI自动生成内容的生产方式。广义的AIGC可以看作是像人类一样具备生...
-
OpenAI:纽约时报雇黑客攻击我
堂堂AI巨头,怎么就被一家报纸雇黑客攻击了? 《纽约时报》诉OpenAI侵犯版权索赔数十亿美元案最新进展: 在最新提交的法庭文件中,OpenAI声称《纽约时报》花钱找黑客攻击ChatGPT,人为制造侵权结果。 使用欺骗性手段进行数万次尝试,才得到高度异常...
-
千卡利用率超98%,详解JuiceFS在权威AI测试中的实现策略
2023 年 9 月,AI 领域的权威基准评测 MLPerf 推出了 Storage Benchmark。该基准测试通过模拟机器学习 I/O 负载的方法,在不需要 GPU 的情况下就能进行大规模的性能压测,用以评估存储系统的在 AI 模型训练场景的适用性。...
-
谷歌豪掷6000万美元购买Reddit 数据 用来训练AI模型
Reddit 最近宣布与一家未透露的公司签署了一份价值6000万美元的合作协议,允许对 Reddit 用户内容进行访问以训练 AI 模型。而后,揭晓这家神秘公司正是谷歌。 图源备注:图片由AI生成,图片授权服务商Midjourney 根据合同,谷歌每年将...
-
近屿智能发布AIGC大模型工程师和产品经理学习路径图
近日,上海近屿智能科技有限公司(下称“近屿智能”),基于其在大模型研发和产品设计领域深厚的专业积累,终于总结出AIGC大模型工程师与产品经理的学习路线图。该学习路线图不仅为追求专业发展的学习者提供了一条清晰明确的AIGC大模型学习路径,更为整个AIGC大模...
-
Stable Diffusion学习指南【安装篇】
在上一篇的教程中,我为大家介绍了Stable Diffusion的原理、发展历程和优点,大家应该对Stable Diffusion这款AI绘画工具有了初步的了解,而这一篇我将教你如何在自己电脑上轻松部署WebUI。 Stable Diffusion历史文...
-
高质量论文中文翻译:Lag-Llama: 朝向基础模型的概率时间序列预测 Lag-Llama: Towards Foundation Models for Probabilistic Time S
Lag-Llama: 朝向基础模型的概率时间序列预测Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 文章目录 摘要 介绍 我们的贡献...
-
逻辑推理大翻车!GPT-4、Gemini被曝重大缺陷,LLM严重降智
近期,谷歌DeepMind和斯坦福的研究人员发现大型语言模型在处理逻辑推理任务时,前提信息的呈现顺序对其表现具有决定性影响。 在逻辑推理和数学问题中,前提按照逻辑自然顺序排列时,模型表现更佳。对于大型语言模型,改变前提叙述顺序会导致性能大幅下降,尤其是在添...
-
【AIGC】基于深度学习的图像生成与增强技术
摘要: 本论文探讨基于深度学习的图像生成与增强技术在图像处理和计算机视觉领域的应用。我们综合分析了主流的深度学习模型,特别是生成对抗网络(GAN)和变分自编码器(VAE)等,并就它们在实际应用中的效果和局限性展开讨论。通过比较实验和案例研究,我们评估了不...
-
Stable Diffusion(SD) Lora模型
Lora模型 1. Lora模型tag 1.1 打tag路径 1.2 打tag准备 1.3 分类进行打tag 2. Lora模型训练核心参数 2.1 步数相关 repeat / epoch / batch_size 2.1.1 imag...
-
CUDA驱动深度学习发展 - 技术全解与实战
全面介绍CUDA与pytorch cuda实战 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收...
-
Differential Diffusion官网体验入口 AI图像生成编辑平台免费在线使用地址
Differential Diffusion是一个图像生成和编辑的平台,可以根据文本提示以及指定每个区域变化量的地图来修改图片。它能够为每个像素或图像区域提供定制化的变化量控制。这种细粒度的变化量控制为各种新的编辑能力打开了大门,例如控制个别对象被修改的程...
-
OpenAI回应“ChatGPT发疯”问题:token预测是根源
近期,ChatGPT意外发生失控事件,用户纷纷报告收到混乱而令人震惊的回复,引起Reddit、HN等社交平台上广泛的讨论。OpenAI迅速做出回应,确认问题源于「token预测」,并表示已成功修复。 ChatGPT用户在向模型提问时,突然发现其回复变得毫无...
-
Karpathy新视频又火了:从头构建GPT Tokenizer
技术大神卡帕西离职OpenAI以后,营业可谓相当积极啊。 这不,前脚新项目刚上线,后脚全新的教学视频又给大伙整出来了: 这次,是手把手教咱构建一个GPT Tokenizer(分词器),还是熟悉的时长(足足2小时13分钟)。 Ps. 上次讲课还是俩月前的...
-
OpenAI员工自曝996作息表,网友:真正的卷不需要强迫
OpenAI也996,实锤了(doge)。 思维链作者、从谷歌跳槽OpenAI的Jason Wei刚刚分享了自己在OpenAI的一天: [9:00am] 起床[9:30am] 搭乘Waymo前往Mission SF,途中在Tartine买个牛油果吐司[9...
-
英伟达NeMo框架在AI领域的综合应用与优势总结
一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架,源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...
-
全网最全Stable Diffusion原理快速上手,模型结构、关键组件、训练预测方式!!!!
手把手教你入门绘图超强的AI绘画程序,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包(文末可获取) 【AIGC】Stable Diffusion的建模思想、训练预测方式快速 在这篇博客中,将会用机器学习入门级描...
-
生成式人工智能和数据质量可以共存吗?
在这个高科技的时代,想必大家对于生成式人工智能并不陌生,至少都有听说过。但对于人工智能所生成的数据,大家始终有所顾虑,这就不得不涉及到数据质量了。 在这个高科技的时代,想必大家对于生成式人工智能并不陌生,至少都有听说过。但对于人工智能所生成的数据,大家...
-
DDC技术:AIGC网络的革命性解决方案
2023年,人工智能生成内容(AIGC)技术将蓬勃发展,其中ChatGPT作为一个典型案例,在文本生成、代码开发和诗歌创作等多个领域引起行业变革。DDC技术对改变网络格局具有创新和突破性意义,很大程度上提升了效率和连接性。本文将介绍这一AIGC网络的新一代...
-
AIGC专题:AIGC产业链近况更新
今天分享的是AIGC系列深度研究报告:《AIGC专题:AIGC产业链近况更新》。 (报告出品方:国联证券) 报告共计:19页 AIGC 正反馈持续加强 依托于强大的算力基础设施和海量的通用数据,经过训练和不断调优打造出了 AIGC 大模型,到中...
-
AI自动化标注崛起,数据标注员要失业了?
在数据标注行业流行着一句话:“有多少智能,就有多少人工”。 由于需要标注的数据规模庞大且成本较高,一些互联网巨头及一些AI公司很少自己设有标注团队,大多交给第三方数据服务公司或者数据标注团队来做。 这也衍生出了专为AI而生的人力密集型的数据标注产业链。...
-
AIGC实战——能量模型(Energy-Based Model)
AIGC实战——能量模型 0. 前言 1. 能量模型 1.1 模型原理 1.2 MNIST 数据集 1.3 能量函数 2. 使用 Langevin 动力学进行采样 2.1 随机梯度 Langevin 动力学 2.2 实现 Langevin...
-
Python进行AI声音克隆的端到端指南
人工智能语音克隆是一种捕捉声音的独特特征,然后准确性复制它的技术。这种技术不仅可以让我们复制现有的声音,还可以创造全新的声音。它是一种彻底改变内容创作的工具,从个性化歌曲到自定义画外音,开辟了一个超越语言和文化障碍的创意世界。 本文的将提供利用AI语音...
-
Nomic AI 发布首个完全开源的长文本嵌入模型,超越 OpenAI Ada-002在各项基准测试中的表现
在自然语言处理(NLP)领域不断发展的背景下,理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力,特别是通过文本嵌入的发展。这些嵌入成为许多应用的基础,包括大型语言模型(LLMs 的检索增强生成和语义搜索。它们将句子或文档转换为低维向...
-
【AIGC-文本/图片生成视频系列-10】SparseCtrl:在文本生成视频的扩散模型中添加稀疏控制
目录 一. 项目概述 二. 方法详解 三. 应用结果 四.个人思考 由于扩散模型生成空间的不确定性,仅仅通过文本生成视频时,会导致模糊的视频帧生成。 今天解析的SparseCtrl,是一种有效解决上述问题的方案,通过带有附加编码器的时间稀疏条...