-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
用活人脑细胞构建AI系统,语音识别准确率提升至78%
近期一项前沿的类脑研究登上了Nature子刊,研究人员利用活人脑细胞构建了一个新型AI系统,这一突破意味着语音识别准确率有望大幅提升。这个系统可以进行无监督学习,并具有类似神经网络的功能。此外,研究人员还发现,系统的学习能力取决于脑类器官中神经细胞之间的连...
-
用活人脑细胞造AI系统!语音识别已成功,可无监督学习
由真实人脑细胞构建的“迷你大脑”和微电极组成的AI系统,已经能够进行语音识别—— 从数百个声音片段中准确认出某个特定人的声音的那种。 最近,一项颇为前沿的类脑研究登上了Nature子刊。 这个特别的AI系统甚至可以进行无监督学习: 研究人员只是一遍遍...
-
Runway官宣下场通用世界模型!解决视频AI最大难题,竟靠AI模拟世界?
【新智元导读】Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。 最近AI视频赛道的Pika1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果。 面对Pika的步步紧逼,本以为R...
-
关于AIGC的一些概念和应用
一.AIGC的技术特点以及在各个领域的应用 AIGC是指人工智能生成内容(Artificial Intelligence Generated Content)。这是一个基于人工智能技术的应用,它可以通过训练大量的数据,学习人类语言的特征和模式,并生成各种...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
火星探测器背后的人工智能:从原理到实战的强化学习
本文详细探讨了强化学习在火星探测器任务中的应用。从基础概念到模型设计,再到实战代码演示,我们深入分析了任务需求、环境模型构建及算法实现,提供了一个全面的强化学习案例解析,旨在推动人工智能技术在太空探索中的应用。 关注TechLead,分享AI全...
-
神经网络是如何工作的? | 京东云技术团队
作为一名程序员,我们习惯于去了解所使用工具、中间件的底层原理,本文则旨在帮助大家了解AI模型的底层机制,让大家在学习或应用各种大模型时更加得心应手,更加适合没有AI基础的小伙伴们。 一、GPT与神经网络的关系 GPT想必大家已经耳熟能详,当我们与它...
-
AI一把火烧过来,谁会成为下一个诺基亚?
ChatGPT一把大火烧过来,消费电子厂商齐刷刷地望向AI。 国内,全球最大的个人电脑(PC)制造商联想推出了AI PC;小度、天猫精灵、小爱同学等智能音箱开始了新一轮与AI的热恋;vivo将AI大模型装入智能手机,华为、小米、OPPO等国产厂商也在探索硬...
-
时序分析中的常用算法,都在这里了
时序分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征。这是一类相对比较复杂的预测建模问题,和回归分析模型的预测不同,时间序列模型是依赖于事件发生的先后顺序的,同样大小的值改变顺序后输入模型产生的结果是不同的。 时序问题都看成是...
-
Stability AI推出Stable Diffusion XL 1.0,文本到图像模型
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。 Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强...
-
行业排名第一!一图了解理想Mind GPT中文大模型
快科技12月11日消息,在理想汽车智能软件发布会上,理想带来了Mind GPT,这是理想全自研的多模态认知大模型,目前还处于内测版本。 据悉,Mind GPT是行业唯一不需要任何指令词就可以使用的大模型,也是行业唯一真正围绕车载场景打造的大模型...
-
理想汽车:理想Mind GPT中文大模型综合性评测榜第一名!
快科技12月10日消息,在刚刚举行的理想汽车智能软件发布会上,理想汽车官宣,在OTA 5.0中,理想同学最大的变化,就是引入了Mind GPT的能力。 Mind GPT是理想全自研的多模态认知大模型,它可以与汽车进行一个完美的融合,让每位家庭成员都能在车里...
-
ChatGPT与Google Bard那个更好?
AIGC 行业最大的两个竞争对手:ChatGPT vs Google Bard! 本文介绍这两个人工智能引擎之间的技术差异。 截至目前Google Bard和ChatGPT之间最大的区别是:Bard知道ChatGPT,但ChatGPT却对Bard懵然不知。...
-
却话文心一言(Chatgpt们),存算一体真能突破AI算力“存储墙”|“能耗墙”|“编译墙”?
文心一言折戟沉沙 作为国内搜索引擎巨头玩家,百度在中文语料领域拥有大量的积累,在算力基础设施等层面也拥有优势。 但是国产化AI芯片的处境其实很难。 这不是危言耸听,也不是崇洋媚外。这不,百度文心一言初战吃瘪。...
-
Stable Diffusion 文字生成图片如何写提示词
Stable Diffusion是一种基于神经网络的技术,通过输入提示词来生成相应的图片。为了获得高质量的图片输出,您需要选择合适的提示词,并确保它们能够激发模型的想象力和创造力。 以下是一些编写提示词的建议: 确定主题:首先,确定您希望生成的图片的...
-
一条磁力链接席卷AI圈,87GB种子直接开源8x7B MoE模型
「高端」的开源,往往采用最朴素的发布方式。 昨天,Mistral AI 在 X 平台甩出一条磁力链接,宣布了新的开源动作。 没有长篇官方博客,没有刻意加速的 Demo,这家公司算是当下大模型领域的「一股清流」。 打开一看,发现是接近 87 GB 的种子...
-
一文读懂常用的 “生成式 AI 框架”
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - Gen AI ,即“生成式 AI” 技术。 随着 AI 技术的不断发展,Gen AI 的力量超越了单纯的技术奇迹,更是一种具有变革性的动态力量,深刻地塑造了...
-
【原创】AIGC之ChatGPT工作原理
AIGC是什么 AIGC - AI Generated Content (AI生成内容),对应我们的过去的主要是 UGC(User Generated Content)和 PGC(Professional user Generated Content...
-
理解DALL·E 2, Stable Diffusion和 Midjourney工作原理
编者按:随着AIGC的兴起,各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。 本期IDP Inspiration,小白将和大家一同走进这三者背后的技术原理,一探究竟。 以下是译文,Enj...
-
怎么用AI绘画?手把手教你使用
与传统的绘画方式不同,AI绘画软件采用了人工智能算法和计算机视觉技术,使艺术作品的创作变得更加智能化和自动化。这样,即使一个看不懂颜料,也毫无绘画经验的业余者也能创作出可圈可点的艺术品了。AI绘画软件因此被越来越多的创作者和爱好者所使用。那你们知道...
-
百度AI模型“文心一言”新鲜体验
今天收到通知可以体验百度的AI模型“文心一言”,等了一个多月迫不及待的去体验了一把,以下是体验的相关记录。 1、简单介绍 通过文心一言官网链接https://yiyan.baidu.com/进入,看到如下界面: 在文心一言的自我介绍中,作为人...
-
AIGC实战——WGAN(Wasserstein GAN)
AIGC实战——WGAN 0. 前言 1. WGAN-GP 1.1 Wasserstein 损失 1.2 Lipschitz 约束 1.3 强制 Lipschitz 约束 1.4 梯度惩罚损失 1.5 训练 WGAN-GP 2. GAN 与...
-
MAC搭建M1环境的stable-diffusion
MAC M1 搭建 stable-diffusion 环境 文章目录 MAC M1 搭建 stable-diffusion 环境 环境准备 1. 硬件环境 2. 系统环境 3. 基础软件环境 主要参考资料 操作步骤 1. 下载g...
-
AI绘画生成器推荐AI绘画自动生成器有哪些?
1、DALL-E2 DALL-E2 是由 OpenAI 开发的 AI 图像生成器。只需几分钟,你就可以使用 AI 创建高度逼真的图像。 2、Deep Dream Generator Deep Dream是一个经过数百万张图像训练的神经网络。使用方便,...
-
【AI绘画-stableDiffusion】图片放大;高清修复;重绘幅度调参讲解;SD upscale 放大脚本
总览 文章参考:https://www.bilibili.com/video/BV11m4y12727/?spm_id_from=333.788.recommend_more_video.-1&vd_source=38d6ea3466db371...
-
各家LLM大模型写作能力大比拼【GPT4、ChatGPT、ChatGLM-6B、ChatGLM-130B、文心一言、讯飞星火、Claude+】《人工智能之神经网络的前世今生和未来发展趋势》为标题
禅与计算机程序设计艺术评测结论: GPT4 > ChatGLM-130B > ChatGPT > 讯飞星火 > 文心一言 ~ ChatGLM-6B > Claude+ 文章目录 Prompt: 你...
-
【扩散模型】2、DDPM | 去噪扩散概率模型开山之作
文章目录 数学基础知识 一、背景 二、DDPM 主要过程 2.1 前向扩散过程 2.2 逆向去噪过程 2.3 训练和推理 论文:Denoising Diffusion Probabilistic Models 代码:http...
-
JetBrains 推出新 AI 编码助手,结合多个大型语言模型以实现供应商中立
JetBrains 于当地时间周三发布了一款新的 AI 编码助手,这款助手能够从开发者的集成开发环境(IDE)获取信息,并将其反馈给 AI 软件,以提供编码建议、代码重构和文档支持。这家开发工具公司声称,其 AI 助手是第一个供应商中立的此类产品,因为它使...
-
深度学习实战28-AIGC项目:自动生成定制化的PPT文件
大家好,我是微学AI,今天给大家介绍一下深度学习实战28-AIGC项目:自动生成定制化的PPT文件,AIGC项目是一个基于自然语言处理技术的创新性项目,旨在利用ChatGPT模型生成定制化的PPT文件。该项目主要应用于商务和教育领域,可以帮助用户快速创建具...
-
语言模型:GPT与HuggingFace的应用
本文分享自华为云社区《大语言模型底层原理你都知道吗?大语言模型底层架构之二GPT实现》,作者:码上开花_Lancer 。 受到计算机视觉领域采用ImageNet对模型进行一次预训练,使得模型可以通过海量图像充分学习如何提取特征,然后再根据任务目标进行模型...
-
每个人工智能工程师都应该了解的十大人工智能工具和框架
为了在竞争中保持领先地位,我们在此博客中列出了每位 AI 工程师都应该了解的2023 年最佳 AI 工具,包括 TensorFlow、PyTorch、sci-kit-learn 和 Apache Spark。准备好在2023 年获得最佳AI 工程师认证,...
-
视觉CV-AIGC一周最新技术精选(2023-11)
PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型(LMM)扩...
-
打造AI虚拟数字人,Stable Diffusion+Sadtalker教程
站长笔记 2 个月前 1 1k 如何使用Stable Diffusion整合Sadtalker Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU...
-
思维链提出者Jason Wei:关于大模型的6个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研...
-
思维链提出者Jason Wei:关于大模型的六个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI...
-
MIT新创公司Liquid AI融资近4千万美元,希望构建新型液态神经网络人工智能
Liquid AI,一家由MIT孵化的新兴公司,近日成功完成了一轮接近4千万美元的种子轮融资,其目标是构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,旨在提供更为精简、可解释且动态适应的人工智能系统。 Liquid A...
-
国内AI顶会CPAL论文录用结果放出!共计30篇Oral和60篇Spotlight
大家可能还记得,今年五月份公布的,将由国内大佬马毅和沈向洋牵头办的全新首届AI学术会议CPAL。 这里我们再介绍一下CPAL到底是个什么会,以防有的读者时间太久有遗忘—— CPAL(Conference on Parsimony and Learning...
-
motionface respeak新的aigc视频与音频对口型数字人
在当今的数字化时代,人工智能(AI)正在逐渐渗透到我们生活的方方面面。其中,AI技术在视频制作和处理领域的应用也日益广泛。本文将探讨如何利用AI技术实现视频中人脸与音频同步对口型的方法,旨在进一步丰富视频制作的效果和表现形式。 数字人一件...
-
ControlNet多重控制功能推出,AI绘画进入导演时代!
目录 一、“不会开发游戏的AI工具制作者不是好博士” 二、ControlNet出现的背景 三、什么是ControlNet? 四、「神采 Prome AI」的诞生 五、总结 去年DALLE2,Stable Diffusion等文-图底层大模型发...
-
大模型LLaMA和微调LLaMA
1.LLaMA LLaMA的模型架构:RMSNorm/SwiGLU/RoPE/Transformer/1-1.4T tokens,和GPT一样都是基于Transformer这个架构。 1.1对transformer子层的输入归一化 与Transf...
-
面向AI开发的六种最重要的编程语言
作者丨FATIH KÜÇÜKKARAKURT 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 在AI开发界,你使用的编程语言很重要。每种语言有其独特的特性。选择合适的语言不是关乎个人偏好的...
-
AI文生视频,会在明年迎来“GPT时刻”
在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。 而与之相比,AI文生视频,却是一个迟迟未被“攻下”的阵地。 抖动、闪现、时长太短,这一系列缺陷,让AI生成的视频只能停留在“图一乐”的层面,很难拿来使用,更不要说提供商...
-
高级勒索软件活动突出了对AI网络防御的需求
Deep Instinct的CIO Carl Froggett在访谈中谈到了2024年预算重点向勒索软件预防技术转变,他预计AI,特别是深度学习,将更多地融入业务流程,自动化工作流,并塑造工作场所体验。 勒索软件攻击的新趋势是什么,企业应该如何使用A...
-
Rain AI vs NVIDIA:奥特曼执掌的OpenAI想改变AI芯片游戏规则?
摆脱昂贵的NVIDIA芯片已经成为AI公司的梦想,就连大名鼎鼎的OpenAI也不例外。OpenAI 董事会开除山姆·奥特曼(Sam Altman)事件爆发不久后,就有消息传出奥特曼曾与许多投资者洽谈,打算募资成立一家新的AI 芯片公司。 如今这件事也有...
-
麦肯锡:银行业每年有望从生成式AI获得2000亿至3400亿美元利润
《麦肯锡》最新文章强调,生成式人工智能(gen AI)在银行业具有巨大的潜在价值,全球范围内可为各产业每年增加2.6万亿至4.4万亿美元的价值。在这其中,银行有望获得年度潜在利润达2000亿至3400亿美元,相当于运营利润的9%至15%。 为了充分利用这一...
-
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models
AI绘画后面的论文——ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models 代码:lllyasviel/ControlNet: Let us control di...
-
【stable diffusion 小白最全详细使用教程+大模型资源】
文章目录 一、前言 二、安装 1.解压后点击启动器运行依赖,然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中 三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...
-
颠覆Transformer霸权!CMU普林斯顿推Mamba新架构,解决致命bug推理速度暴增5倍
深度学习进入新纪元,Transformer的霸主地位,要被掀翻了? 2017年6月12日横空出世,让NLP直接变天,制霸自然语言领域多年的Transformer,终于要被新的架构打破垄断了。 Transformer虽强大,却有一个致命的bug:核心注意力...
-
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑战者,引起大量关注: Mamba(曼巴,一种蛇),在语...