-
【AIGC专题】Stable Diffusion 从入门到企业级实战0402
精准控制图像生成。上一节,我们介绍了《Stable Diffusion ControlNet InpAInt模型 一、概述 本章是《Stable Diffusion 从入门到企业级实...
-
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。 最近,来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。 它能够通过单一冻结模型,处...
-
Stable Diffusion之最全详解图解
慕尼黑大学的CompVis研究团体开发的各种生成性人工神经网络之一。它是由初创公司StabilityAI、CompVis与Runway合作开发,并得到EleutherAI和LAION的支持。 截至20...
-
开源的Gemma 模型:Google 的语言奇迹,让你用指令调优、低秩适应和 Switch Transformer 玩转小模型
代表性的是基于 Transformer 的大规模预训练语言模型(Large-scale Pre-trAIned Language Model,LLM)。Transformer 是一种基于自注意力机制(...
-
webassembly003 whisper.cpp的python绑定实现+Cython+Setuptools
ython绑定', author='Luke Southam', author_emAIl='luke@devthe.com', libraries=[whisper_clib...
-
一种推荐系统中的排序学习的原创算法:斯奇拉姆排序
典的算法比如 BPR 和 CLiMF 早在 10 多年前就已经被发明。因此当 2023 年国际会议 AIBT 2023 上有学者提出斯奇拉姆排序时,众多听众眼前一亮。该算法因此获得了最佳论文报告奖。本...
-
补齐Transformer规划短板,田渊栋团队的Searchformer火了
常遵循明确定义的基于规则的搜索过程。 为了让 Transformer 具备复杂推理能力,Meta FAIR 田渊栋团队近日提出了 Searchformer。 论文标题:Beyond A∗: Be...
-
这款对标ChatGPT的国产MoE大模型重磅更新!集AI对话、AI绘画、AI阅读、AI写作于一体!
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享A...
-
下个爆点人形机器人?OpenAI、英伟达、贝索斯向同一家公司投了6.7亿刀
生成式 AI 的竞争如火如荼,各家科技公司和机构也没有忘记投资下一个热点。 本周五,彭博社援引消息人士的话报道称,亚马逊创始人杰夫・贝索斯、英伟达和其他大型科技公司正在不约而同地投资初创公司 Fig...
-
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable...