-
AI绘画:Stable-diffusion程序的突破与未来展望
随着人工智能技术的快速发展,AI绘画已经成为了一个备受关注的前沿领域。在这其中,Stable-diffusion程序作为一款优秀的AI绘画工具,以其独特的风格和强大的功能,受到了广泛的关注和赞誉。本文将对Stable-diffusion程序进行深入解析,探...
-
[AIGC] 21世纪Java与Go的相爱相杀
在21世纪的软件开发领域中,Java和Go这两门编程语言可谓是相爱相杀的存在。它们各自拥有着强大的特点和独特的优势,同时也存在着一些明显的竞争和冲突。让我们来看看这两门语言的故事,以及它们之间的深远意义。 文章目录 Java的魅力...
-
Midjourney V6超深度评测;开源人工智能:创新的前沿
? AI新闻 ? Midjourney V6超深度评测:超现实主义细节爆表 摘要:国外网友Andre Kovalev对Midjourney V6进行了超深度评测,发现V6相较于V5.2在图片真实感、细节表现方面有较大提升。V6拥有超现实主义的特点,...
-
论文降重ai写作 ai写作
大家好,今天来聊聊论文降重ai写作 ai写作,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 论文降重AI写作:全新的降重方式与体验 随着人工智能技术的不断发展,AI写作已经逐渐渗透到各个领域...
-
7款免费的Midjourney平替平台
AI艺术生成器正在改变设计和内容的制作方式。像Midjourney这样的工具已经将困难的想法转化为令人惊叹的视觉效果,改变了创造力的运作方式。但是,AI艺术涵盖了许多风格和需求。这就是Midjourney替代方案变得重要的原因(特别是免费的替代方案,使AI...
-
用通俗易懂的方式讲解:十分钟读懂 Stable Diffusion 运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊艳其出色表...
-
羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读
论文地址:https://arxiv.org/pdf/2307.09288.pdfd 代码地址:GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...
-
酒精和肠内外健康:有帮助还是有害?
谷禾健康 酒精与健康 饮酒作为一种特殊的文化形式,在我们国家有其独特的地位,在几千年的发展中,酒几乎渗透到日常生活、社会经济、文化活动之中。 据2018年发表的《中国饮酒人群适量饮酒状况》白皮书数据显示,中国饮酒人...
-
Midjourney室内设计案例精选:设计师的灵感之源,装修者的实用指南 下
AIGC讨论威:qigeai7777 所有的提示词x球:七哥的AI日常 gzh:七哥的AI日常 016 Shabby Chic Shabby Chic 室内设计是一种注重浪漫、独特和怀旧感觉的风格,强调家居装饰的柔和、磨损和复古特质。这种设计风格源...
-
Midjourney室内设计案例精选:设计师的灵感之源,装修者的实用指南 上
AIGC讨论威:qigeai7777 所有的提示词x球:七哥的AI日常 gzh:七哥的AI日常 对于设计师而言,寻找灵感、尝试新的配色和布局是一项持续的挑战。而Midjourney的室内设计作品,凭借其独特的AI生成技术,为设计师们提供了一个全新的灵...
-
stable diffusion微调总结
stable diffusion微调总结 stable diffusion 模型类别: SD SD2 SDXL SDXL LCM(潜在一致性模型) SDXL Distilled SDXL Turbo 安装accelerate 通过pip...
-
llama/llama2论文解读
llama 摘要 llama在约1.4T的token上,训练出参数量7B到65B的模型,其模型规模如下 在仅使用开源数据集的情况下,llama-13B在多数benchmarks上与GPT-3效果相当;llama-65B也与最好的模型(Chin...
-
2023年的深度学习入门指南(19) - LLaMA 2源码解析
2023年的深度学习入门指南(19 - LLaMA 2源码解析 上一节我们学习了LLaMA 2的补全和聊天两种API的使用方法。本节我们来看看LLaMA 2的源码。 补全函数text_completion源码解析 上一节我们讲了LLaMA 2的...
-
引领Midjourney Logo设计新潮流:激发创意,探索无限可能 - V5版 (下)
我们继续 所有提示词:qigeai7777 37、Emblem of Power Logo “Emblem of Power” 这个词组翻译成中文是“权力的象征”或“权力的标志”。它可能用来表示一个组织、团体、品牌或产品的标志,强调权力、权威或影响力...
-
【AI绘画】Stable Diffusion扩散模型 + Consistency一致性模型 小白必看!!!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 1 GAN到Stable Diffusion的改朝换代 2 从DDPM到Stable Diffusion发展史...
-
Chat gpt和文心一言谁最具有优势
目录 chat gpt 开发者和背景 技术和架构 应用和性能 可用性和开放性 优化和特性 它们俩谁更好用 chat gpt ChatGPT和文心一言(Ernie Bot)都是大型语言模型,但它们由不同的组织开发,基于不同的...
-
ChatGPT高效提问—基础知识(AIGC)
ChatGPT高效提问—基础知识 为了更好地学习AI和prompt相关知识,有必要了解AI领域的几个专业概念。 1.1 初识AIGC AIGC(artificial intelligence generated content)即人工智能生成的内...
-
GLM团队开源超拟人大模型CharacterGLM 6B版
清华CoAI团队、聆心智能团队、GLM技术团队联手研发了CharacterGLM,一个专门为定制中文AI角色设计的模型,参数规模从6B到66B不等。相较于传统模型,CharacterGLM在表现上更为出色,使用门槛也更低。 为了让AI角色更加逼真,团队深入...
-
通义千问团队发布Qwen1.5 聊天模型性能大幅提升
在近期几个月的深入探索之后,通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。 Qwen1.5的亮点之一是其丰富的模型系列,涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外,团队还开源了包括Int4和Int8的GPTQ...
-
【AIGC】prompt工程从入门到精通
注:本文示例默认“文心大模型3.5”演示,表示为>或w>(wenxin ,有时为了对比也用百川2.0展示b>(baichuan 有时候为了模拟错误输出,会用到m>(mock 表示(因为用的大模型都会给出正确答案) 有时候直接贴网络...
-
斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了
最新一代语言模型(尤其是 GPT-4、PaLM 和 LLaMa)已经成功拓展了自然语言处理和生成的边界。这些大规模模型可以解决许多不同任务,从写莎士比亚风格的十四行诗到总结复杂的医疗报告和解决竞赛级的编程问题。尽管这些模型可以解决多种多样的问题,但它们并...
-
【读点论文】A Survey on Generative Diffusion Model,AIGC时代的新宠儿,从原理推导到工程应用,在视觉,自然语言,语音等领域大展拳脚
A Survey on Generative Diffusion Model Abstract 由于深度潜在表示,深度学习在生成任务中显示出良好的潜力。生成模型是一类可以根据某些隐含参数随机生成观测值的模型。近年来,扩散模型以其强大的生成能力成...
-
AI写作神器,让文章创作变得轻松又高效
尊敬的读者,感谢您关注我们的学术AI写作工具。它具有多项强大功能,能助您便捷且高效地打造出优质文章哦!下面是针对该工具常见问题的解答: 1.学术AI写文章工具是什么? 敬爱的用户,我们为您推出了学术AI写手这一款由人工智能驱动的便捷工具。只需输入您的写...
-
深入探索 Stable Diffusion:AI图像创新的新纪元
深入探索 Stable Diffusion:AI图像创新的新纪元 介绍 Stable Diffusion 的核心功能和应用场景 Stable Diffusion 架构解析 深入 Stable Diffusion 的关键组件 变分自编码器(VA...
-
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
AI智能体,是目前学界炙手可热的前沿话题,被众多专家视为大模型发展的下一个方向。 然而,最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、Meta AI的研究者们发现,AI智能体在现实世界的规划能力还很差。 他们对GPT-4 Turbo、Gemini Pro...
-
音频秒生全身虚拟人像,AI完美驱动面部肢体动作!UC伯克利Meta提出Audio2Photoreal
就在最近,Meta和UC伯克利联合提出了一种全新的虚拟人物形象生成的方法—— 直接根据音频生成全身人像,效果不仅逼真,还能模拟出原音频中包含的细节,比如手势、表情、情绪等等。 图片 论文地址:https://arxiv.org/abs/2401.0188...
-
AI更懂鸡!科学家使用人工智能解码鸡的语言
在一项由达尔豪西大学进行的研究中,科学家们正在运用人工智能(AI)技术,尝试解码鸡的语言。鸡的叫声并非随机声音,而是一种复杂的语言系统,用于表达喜悦、恐惧和社交提示。研究人员希望通过分析鸡的声音模式,从而加深我们对这些羽毛动物及其沟通方式的理解。 该项目被...
-
苹果研究团队揭示WRAP技术:用合成数据进行预训练大模型 成本低准确性高
近几个月来,大型语言模型(LLMs)在人工智能社区中引起了极大的关注和流行。这些模型在文本摘要、问答、代码完成、内容生成等任务中展示出了强大的能力。 然而,LLMs通常在不充分的网络抓取数据上进行训练。这些数据通常杂乱、无结构,表达不清晰。按照现有的扩展原...
-
Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集
【论文翻译】- Segment Anything / Model / SAM论文 论文链接: https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publica...
-
首个环视世界模型DrivingDiffusion: BEV数据和仿真新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度...
-
人工智能:电信行业的希望灯塔
为了有效利用人工智能的变革力量,电信提供商必须从根本上转变思维方式,并采用旨在推动增长的创新商业模式。ChatGPT的出现引发了人们对人工智能的极大兴趣,吸引了从董事会成员和供应商到分析师和活动组织者等各个利益相关者的关注。在这个以数字化转型为主导的时...
-
CES 2024的亮点仅仅聚焦AI深度赋能和产业创新吗?| DALL-E 3、Stable Diffusion等20+ 图像生成模型综述
随着科技飞速发展,CES(国际消费电子展)已然成为全球科技产业的风向标,每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会,不难发现其亮点纷呈,其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点,各大厂商纷纷展...
-
人工智能大时代——AIGC综述
生成式AI分类 模型按照输入输出的数据类型分类,目前主要包括9类。 有趣的是,在这些已发布大模型的背后,只有六个组织(OpenAI, Google, DeepMind, Meta, runway, Nvidia)参与部署了这些最先进的模型。...
-
AIGC面经大全(持续更新)
目录 DDPM算法原理部分: DDIM算法原理部分: ⾼阶采样⽅案: 特征编码篇: Stable Diffusion篇: SDXL篇: ⼤模型微调篇: 控制模型篇: 适配器篇: DDPM算法原理部分: 简述DDP...
-
【AIGC-图片生成视频系列-3】AI视频随心而动:MotionCtrl的相机运动控制和物体运动控制
目录 一. 项目简介 二. 主要贡献 三. 摘要 四. 实现方法和管线 五. 基于 LVDM [1] / VideoCrafter1 [2]的结果 (A 相机运动控制 (B 物体运动控制 (C 相机+物体运动控制 (D 与Vide...
-
张晴晴:对话数据推动AIGC——大模型底层数据探索
“Training data is technology” . 数据即科技,OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球,一周前惊艳亮相的GPT-4更是...
-
LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比
12.10更新:Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理:数据频率和质量,使用聚类和去重方法,基于LSH和dense embedding方...
-
LLaMA模型指令微调 字节跳动多模态视频大模型 Valley 论文详解
Valley: Video Assistant with Large Language model Enhanced abilitY 大家好,我是卷了又没卷,薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师,带来最新的前沿AI知识和工具...
-
大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
大模型的预训练需要耗费巨量的计算资源和数据,因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而,不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用,对预训练模型参数盗用的判断存在以下两方面的新问题: 1) 预训练模型的...
-
.Net接入AzureOpenAI、OpenAI、通义千问、智谱AI、讯飞星火、文心一言大语言模型。
前言 现在在网上搜索.NET接入大模型的帖子很少,有些官方案例只提供java和python的SDK,所以有了这篇.Net的接入大模型文章,目前仅实现对话模型的调用。 这里仅举例通义千问,其他模型实现可以参考Gi他Hub 对您有帮助的话帮忙点个star...
-
从零开始:了解ChatGPT和AIGC基础
1.背景介绍 1. 背景介绍 自2012年的AlexNet在ImageNet大赛中取得卓越成绩以来,深度学习技术已经成为人工智能领域的重要技术。随着算力的提升和模型的优化,深度学习技术已经取得了巨大的成功,应用于图像识别、自然语言处理、语音识...
-
如何用Stable Diffusion生成高质量的图 全网最全介绍!(附资料)
Stable Diffusion无疑是最近最火的AI绘画工具之一,所以本期给大家带来了全新Stable Diffusion 提示词资料包(文末可获取) Stable Diffusion Stable Diffusion是一个开源的图像生成AI系统,...
-
Prompt 驱动架构设计:探索复杂 AIGC 应用的设计之道?
你是否曾经想过,当你在 Intellij IDEA 中输入一个段代码时,GitHub 是如何给你返回相关的结果的?其实,这背后的秘密就是围绕 Prompt 生成而构建的架构设计。 Prompt 是一个输入的文本段落或短语,用于引导 AI...
-
Copilot服务在您所在地区不可用?有效解决办法指南!
微软在昨日凌晨突然重磅升级Copilot服务,也就意味着大家可以不花钱就体验4.0的内核,然而很多玩家却面临服务在您所在地区不可用问题,以下是有效解决办法: 在开始介绍前,先为准备要入手学习AI工具的大家推荐一款内容全面的学习工具——AI研究所。AI研究...
-
Midjourney|文心一格prompt教程[技巧篇]:生成多样性、增加艺术风格、图片二次修改、渐进优化、权重、灯光设置等17个技巧等你来学
Midjourney|文心一格prompt教程[技巧篇]:生成多样性、增加艺术风格、图片二次修改、渐进优化、权重、灯光设置等17个技巧等你来学 1.技巧一:临摹 我认为学习图片类的 prompt,跟学习画画是类似的,最好的学习方法不是直接用模板。...
-
DALL-E 系列:AI绘画背后的惊人真相!!【1个离奇内幕、3个意想不到、5大秘密揭示】
DALL-E 系列:AI绘图原理,根据用户给出的描述,生成与描述相匹配的图像 DALL-E 1 dVAE Transformer DALL-E 2 CLIP 先验 prior decoder(image) DALL-E 3...
-
【思路合集】talking head generation+stable diffusion
1 以DiffusionVideoEditing为baseline: 改进方向 针对于自回归训练方式可能导致的漂移问题: 训练时,在前一帧上引入小量的面部扭曲,模拟在生成过程中自然发生的扭曲。促使模型查看身份帧以进行修正。 在像VoxCeleb或L...
-
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
去年 4 月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA(Large Language and Vision Assistant)。尽管 LLaVA 是用一个小的多模态指令数据集训练的,却在一些样本上展示了与 GPT-4...
-
小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜
最近,有一群来自小红书的 95 后神秘团队,自称 InstantX,搞了个大动作 —— 开源「InstantID」项目。 InstantID 凭借着高质量的图像生成能力,在开源界掀起了一股热潮:不仅获得了众多技术大佬的点赞,更是在 GitHub 热榜上迅...
-
Depth Anything:释放大规模无标注数据的深度估计
本文经自动驾驶之心公众号授权转载,转载请联系出处。 24年1月论文“Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data“,来自香港大学、字节、浙江实验室和浙江大学。 这项...