-
AI图像生成新纪元:Ideogram 2.0的突破与行业响应,Midjourney开放免费网页版!附订阅教程
随着Ideogram 2.0的发布,AI图像生成能力被推向了全新的高度。 1.Ideogram 2.0是什么? Ideogram 2.0是最新推出的AI文本到图像生成模型,设计的初衷通过人工智能技术提供更精细、更优质的图像生成服务。 长期以来,对于...
-
【diffusers极速入门(七)】Classifier-Free Guidance (CFG)直观理解以及对应代码
系列文章目录 【diffusers 极速入门(一)】pipeline 实际调用的是什么? call 方法! 【diffusers 极速入门(二)】如何得到扩散去噪的中间结果?Pipeline callbacks 管道回调函数 【diffusers极速...
-
从短视频到AIGC,快手字节重开一局
作者 | 辰纹 来源 | 洞见新研社 从短视频到剪辑工具,从电商到外卖,再到如今的AIGC大模型,快手和字节的竞争从来就没有停止过。 通用大模型方面,快手有快意,字节有豆包;AI图片创作快手有可图,字节有星绘;视频生成大模型,快手有可灵,字节用即梦相...
-
DALL-E-3使用指南
OpenAI发布的DALL-E 3无疑是这一领域的佼佼者。本文将深入分析DALL-E 3的技术特点、应用场景及其对未来图像创作的影响。 一、DALL-E-3的技术特点 DALL-E 3是OpenAI在图像生成领域的最新成果,它基于深度学习技...
-
文心一言:如何备考软考架构师
提问:软考高级:架构师指导,有哪些考点、重点考点有哪些?需要如何备考?案例分析题如何做?论文如何写? 文心一言回答1700字如下: 针对软考高级架构师的考试,以下是对考点、重点考点、备考建议、案例分析题解...
-
zblog自动生成文章插件(百度AI写作配图,图文并茂)
最近工作比较忙,导致自己的几个网站都无法手动更新,于是乎也想偷个懒把,让AI帮忙打理下自己的网站。我接触chatgpt等AI工具还是比较早了,从openai推出gpt3.5就一直在用,说实话,开始的时候用AI自动更新网站还是非常管用的,到后来百度等国内搜索...
-
每日AIGC最新进展(54):中科大提出Pose引导的图像生成模型、韩国科技学院提出发型控制模型、北大提出风格生成数据集CSGO
Diffusion Models专栏文章汇总:入门与实战 GRPose: Learning Graph Relations for Human Image Generation with Pose Priors 在过去的研究中,基于扩散模型的人...
-
05 Midjourney从零到商用·入门篇:Describe反推-让图片变成关键词
大家好,今天告诉大家一个AI出图的小技巧,Midjourney的AI绘图过程几乎就是寻找合适的prompt(提示语,俗称咒语, 的过程,在看到一幅心仪的作品后,就想知道别人是通过什么样的咒语实现的,为了找到合适的prompt,很多同学可以说是绞尽脑汁...
-
微软用AI Agent生成2500万对高质量数据,极大提升大模型性能!
随着ChatGPT、Copliot等生成式AI产品的快速迭代,对训练数据的需求呈指数级增长,同时也是提升大模型性能的关键环节之一。 为了解决训练数据短缺和质量差的难题,微软研究院发布了一个专门用于生成高质量合成数据的的AI Agent——Agent Ins...
-
使用PAI × LLaMA Factory 微调 Llama3 模型
活动地址:使用 PAI × LLaMA Factory 微调 Llama3 模型实现角色扮演 活动时间:7月25日- 9月1日 活动任务:使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估,搭建专属“ AI...
-
美团 AIGC产品经理面经(已拿 offer)
背景:211本科毕业,毕业之后在北京一家中型电商公司做了3年商家后台产品经理,目前通过老薛的朋友关系拿到了美团的offer。 目前还有几家在面试流程中,继续加油? 美团AIGC产品面经-业务面 ?1、自我介绍(每次面试必问)。 ?2、在做XX智...
-
Datawhale AI 夏令营【AIGC文生图】
Datawhale AI 夏令营----AIGC文生图 一、赛事介绍 1、背景知识 2、比赛任务 3、文生图简介 4、数据集介绍 二、Task1 baseline解析 1、导入相关库 2、数据集处理 3、保存数据 4、训练模型,查看训练脚...
-
从大专生到大厂员工,再到AI绘画创业者:我的转型之路
一、2008年的起点 我是2008年从一个小城市的计算机专业大专毕业的。那时的我,怀揣着对大城市的向往和对未来的憧憬,带着一份不安和决心,踏上了前往大城市的列车。二、大城市的闯荡 初到大城市,我感受到了前所未有的压力。学历不高、经验不足,让我在求职路上屡屡...
-
告别AI痕迹:如何让Midjourney创作更自然
Midjourney是一个流行的AI艺术生成工具,它可以帮助艺术家和设计师创造出令人惊叹的视觉作品。然而,有时这些作品可能会带有一些明显的“人工智能”特征,比如过度平滑的边缘、不自然的色彩过渡或者缺乏真实感的细节。以下是5个技巧,可以帮助你在使用Midjo...
-
了解一点智能体(Agent)
百度百科对智能体的定义:智能体,顾名思义,就是具有智能的实体,英文名是Agent。以云为基础,以AI为核心,构建一个立体感知、全域协同、精准判断、持续进化、开放的智能系统。 1 智能体(Agent)是什么? 在计算机科学和人工智能领域,智能体(A...
-
全新系列!魅族Lucky 08手机官宣:首发Flyme AIOS
快科技9月6日消息,星纪魅族科技”官微今日官宣了一款新机魅族Lucky 08,这是魅族手机颜值实用Lucky系列的首款产品。 据介绍,魅族Lucky 08将会首发搭载Flyme AIOS系统,拥有更实用更好用的AI功能,宣称为2000元档颜值实用AI手机标...
-
中国图象图形学学会、蚂蚁集团、CSA大中华区等发起全球AI攻防挑战赛
9月6日上午,在2024Inclusion·外滩大会“以AI守护AI 大模型时代的攻守之道”论坛上,国内首个大模型攻防主题的科技赛事—“全球AI攻防挑战赛”宣布正式启动。该赛事聚焦AI大模型产业实践,设计了攻、防双向赛道,邀请各路白帽黑客、技术人才分别进行...
-
第三十五篇-各大模型测评地址和说明集合
1.Open LLM Leaderboard - 开放式LLM排行榜 测评地址:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard 说明:使用Eleuther...
-
猫头虎分享:CSDN博客最多可以创建多少个专栏?
? 猫头虎分享:CSDN博客最多可以创建多少个专栏? 摘要 ? 在CSDN博客平台上,不同级别的用户可以创建的专栏数量有所不同。本文将详细介绍CSDN博客创建专栏的具体数量限制,并且对不同等级用户所能创建的专栏数进行详细解析。无论是小白还是大佬,都...
-
AI绘画工具Ideogram测评:和Midjourney不分伯仲的AI图像工具之一
Ideogram 是一款令人印象深刻的人工智能图像工具,但尽管它于去年 8 月推出并具有不可思议的文本渲染能力,但它并没有引起其他一些更引人注目的 GenAI 服务的关注。 随着该公司推出其生成式人工智能模型 1.0 版本,这种情况即将发生改变,该模型能...
-
我觉得我用于Stable Diffusion进行AI绘画的电脑选对了
选电脑用于Stable Diffusion这件事折磨了我好久,目前知乎推荐电脑都是从游戏和办公的角度去推荐的。虽然现在的SD有很多注册教程,但是注册教程里只是简单的说了硬件要求,没有一篇文章和视频教一个电脑小白怎么选个用于SD进行绘画的电脑。本文从需求背景...
-
Datawhale AI夏令营第四期 AIGC文生图方向 Task3学习笔记
经过前两个task的学习,对于文生图的基本原理,技术支持,模型微调,工作流程等有了一定的了解,尤其是在prompt工程上面,提示词的质量决定着生成图像的流畅性和观赏性,AI大模型在这一方面为学习者们提供了非常大的帮助,通过大模型生成和优化提示词,能实现学习...
-
AI绘画SD教程 | StableDiffusion像素风格绘制,轻松制作复古怀旧像素游戏画面风格,保姆级教程带你快速入门!
大家好,我是画画的小强 像素风设计一直是一股潮流,现在有了AI绘画工具Stable Diffusion,画像素画从来没有这么简单。今天我就教你如何用SD画出好看的像素画,无论是用来做头像还是设计素材甚至用来当做游戏动画资产都可以。 01、理解像素风格...
-
蚂蚁数科CEO赵闻飙:大模型不是产业数字化的唯一解
“过去一年,蚂蚁数科客户数增长35%。旗下多个产品取得所属赛道市场份额第一。”9月5日下午,蚂蚁数科CEO赵闻飙在外滩大会媒体交流会上透露。这是自今年3月份蚂蚁数科独立化运营后,赵闻飙首次对外公布公司的业务进展及战略布局。 赵闻飙还透露,出海是蚂蚁数科的重...
-
国内首个!端到端语音大模型心辰Lingo在外滩大会正式发布上线
9月5日,在外滩大会“大模型的创造力边界与应用想象力”论坛上,大模型创业企业西湖心辰正式发布并上线国内首个端到端语音大模型“心辰Lingo”。 “心辰Lingo”实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信...
-
107 深入解析Llama Index的响应合成器 llamaindex.core.response_synthesizers.facotry.py
深入解析Llama Index的响应合成器 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的一个关键组件——响应合成器(Response Synthesi...
-
Stable Diffusion WebUI 使用ControlNet:IP-Adapter保持生图的角色一致性
IP-Adapter-FaceID可以在保持人脸一致的条件下生成各种风格的图像。 下载 IP Adapter 需要的 Face ID 模型和 Lora 下载地址:https://huggingface.co/h94/IP-Adapter-FaceID/...
-
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:h...
-
外滩大会显露AI产业实践六大趋势 下一代超级应用是智能体
9月5日,2024·Inclusion外滩大会在上海开幕。AI产业的发展是本届外滩大会与会专家和企业家热议的话题,无论是企业界的实践,还是专家学者的研究,各方都认为AI产业实践正呈现六大趋势,涵盖小模型、智能体、专业AI、具身智能等方面,指明了大模型产业落...
-
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面...
-
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天...
-
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低 50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。 在腾讯...
-
制造AI分身,能让内容博主们躺着赚钱吗?
当内容博主陷入倦怠期,怎么办? YouTube博主Kwebbelkop使用的办法是,制作自己的AI分身,自2023年年底开始替代自己,自动创作视频内容,为观众讲解游戏玩法,也让他成为了最早拥抱AI的创作者之一。 YouTube博主“Kwebbelkop...
-
真把自己「当个人」的AI,扫去了我的社交贫困
现代打工人,时常会因为「社交贫困」而四处碰壁,无心工作时不知找谁聊天,讨论气氛热烈时语出惊人,开口就能终结话题,周末出去玩发了朋友圈,后来发现也没有人点赞。 总之一进入社会,就感受到了世界的参差。最近这些尴尬无助的场景,全都有了解决方案。 我们刷到一段聊天...
-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛?:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...
-
FLUX 1 将像 Stable Diffusion 一样完整支持ControlNet组件
之前 InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro 该模型支持 7 种控制模式,包括 canny...
-
使用OpenAI Whisper的说话人识别管道
使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
AIGC 与 ChatGPT 的区别与联系
前言 在人工智能技术飞速发展的今天,生成式人工智能内容(AIGC)和对话式 AI(如 ChatGPT)成为了备受瞩目的话题。虽然这两者在技术基础和应用领域上有很多重叠之处,但它们也各自有独特的特点和用途。本文将深入探讨 AIGC 与 ChatGPT 的...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
探营万平外滩大会科技展:体验AI助手、脑机接口、超写实数字人
2024Inclusion·外滩大会将于明天正式开幕。9月4日,站长之家小编来到大会现场探营,今年围绕科技、人文、可持续三大关键词再次升级,特设10000平方米的科技展览和3000平方米的绿色生活节,为观众带来一场活色生香的沉浸式科技体验。 万平米的科技...
-
如何在家用设备上运行 Llama 3.1 405B?搭建 AI 集群
在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中,开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外,您无需依赖外部提供商或支付任何额外费用。但是,随着模型大小的增加,这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是,张...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
OpenAI宣布启动GPT Next计划:AI性能有望提高100倍
快科技9月4日消息,日前,OpenAI Japan出席了KDDI峰会,介绍了公司即将推出的下一代AI模型,并宣布将在2024年启动GPT Next计划。 OpenAI Japan首席执行官长崎忠雄(Tadao Nagasaki)长崎忠雄在峰会上强调了AI技...
-
深入解读Midjourney的起源和发展历程
深入解读Midjourney的起源和发展历程 1.背景介绍 1.1 人工智能时代的到来 随着计算机技术和算力的不断提升,人工智能(AI 技术正在迅速发展,并逐渐渗透到我们生活的方方面面。在这个新兴的AI时代,各种创新应用层出不穷,其中一个备受瞩目的领...
-
《Llama 3大模型》技术报告中英文版,95页pdf
现代人工智能(AI)系统由基础模型驱动。本文介绍了一套新的基础模型,称为Llama 3。它是一群本地支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个具有4050亿参数和高达128K令牌上下文窗口的密集Transformer。本文对Llama...
-
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南 stable-diffusion-webui-Prompt_Generator项目地址:https://gitcode.com/gh_mirrors/st/...
-
【AI绘画】ComfyUI 入门教程:安装 ComfyUI,AIGC新手入门教程
大家好,我是写编程的木木。 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样: C...
-
Mac 部署Stable Diffusion WebUI和ControlNet的保姆级教程(附安装包)
Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述生成详细图像,它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。详细介绍看维基百科词条Stable Diffusi...
-
Stable Diffusion绘画 | ControlNet应用-Lineart(线稿):轻轻松松画线稿
Lineart(线稿 专门用来提取线稿的算法。 适合对漫画图片进行提取线稿: 不同的预处理器: lineart_standard:适合各种类型的画面 lineart_realistic:适合用于真人图片的线稿提取 lineart_coar...