-
Datawhale AI 夏令营【AIGC文生图】
Datawhale AI 夏令营----AIGC文生图 一、赛事介绍 1、背景知识 2、比赛任务 3、文生图简介 4、数据集介绍 二、Task1 baseline解析 1、导入相关库 2、数据集处理 3、保存数据 4、训练模型,查看训练脚...
-
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:h...
-
外滩大会显露AI产业实践六大趋势 下一代超级应用是智能体
9月5日,2024·Inclusion外滩大会在上海开幕。AI产业的发展是本届外滩大会与会专家和企业家热议的话题,无论是企业界的实践,还是专家学者的研究,各方都认为AI产业实践正呈现六大趋势,涵盖小模型、智能体、专业AI、具身智能等方面,指明了大模型产业落...
-
阿里云创始人王坚:AI 不是AI和产业简单结合
快科技9月5日消息,今日,2024Inclusion外滩大会在上海开幕,本次外滩大会预计将有几十项行业革新产品、标准和研究报告亮相。 在开幕式主论坛上,中国工程院院士、之江实验室主任、阿里云创始人王坚分享了他对AI、AI 和AI基础设施的思考。 他指出,A...
-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛🔗:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...
-
《Llama 3大模型》技术报告中英文版,95页pdf
现代人工智能(AI)系统由基础模型驱动。本文介绍了一套新的基础模型,称为Llama 3。它是一群本地支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个具有4050亿参数和高达128K令牌上下文窗口的密集Transformer。本文对Llama...
-
【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器
项目简介 FLUX.1 是一种新的开源图像生成模型。它由 Stable Diffusion 背后的团队 Black Forest Labs 开发。 官网中有以下功能开源供大家参考: FLUX.1 擅长在图像中准确再现文字,因此非常适合需要清晰文字或...
-
Stable Diffusion 常用模型下载与说明(保姆级)
那么,接下来我们就要学习怎么使用Stable Diffusion 中最重要的各类模型了。 因为,相比于Midjourney,Stable Diffusion最大的优势就是开源。相比于Midjourney靠开发人员开发的少数模型,SD则每时每刻都有人在世界...
-
大模型应用新战场:揭秘终端侧AI竞争关键
2024年过去2/3,大模型领域的一个共识开始愈加清晰: AI技术的真正价值在于其普惠性。没有应用,基础模型将无法发挥其价值。 于是乎,回顾这大半年,从互联网大厂到手机厂商,各路人马都在探索AI时代Killer APP的道路上狂奔。这股风潮,也开始在顶级学...
-
逼真到被打假!OpenAI投的机器人身穿衣服做家务,被怀疑人类套壳拍视频
微软和OpenAI投资的人形机器人公司,又上新了! 来自挪威的机器人公司1X Technologies,发布了全新一代家务机器人NEO的原型。 不同于那些只有机械骨骼的钢铁巨兽,NEO穿上了人类一样的衣服,看上去更像人了。 NEO专为居家场景而打造,手部...
-
【Datawhale X 魔搭 AI夏令营第四期-AIGC方向】 Task1笔记:跑通baseline
前言 Datawhale的官方速通文档:https://linklearner.com/activity/14/10/24 本篇文章基于官方文档内容进行归纳总结。 跑通代码 Step0:开通阿里云PAI-DSW试用 阿里云PAI-DSW(Data...
-
Chinese-Llama-2-7b 开源项目教程
Chinese-Llama-2-7b 开源项目教程 Chinese-Llama-2-7b开源社区第一个能下载、能运行的中文 LLaMA2 模型!项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-Llama-2...
-
AIGC文生图 Task01#Datawhale X 魔搭AI夏令营
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。以下是笔者对Task01教程的一些记录。 30min速通指...
-
让AI更懂物理世界,人大北邮上海AI Lab等提出多模态分割新方法
让AI像人类一样借助多模态线索定位感兴趣的物体,有新招了! 来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下...
-
DataWhaleX魔搭夏令营第四期AIGC方向task01笔记
从零入门AI生图原理&实践是Datawhale AI 夏令营(第四期)“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 在task01中,我们主要在魔搭社区搭建PAI实例并体验一下baselin...
-
Stable Diffusion的微调方法原理总结
目录 1、Textural Inversion(简易) 2、DreamBooth(完整) 3、LoRA(灵巧) 4、ControlNet(彻底) 5、其他 1、Textural Inversion(简易) 不改变网络结构...
-
The Llama 3 Herd of Models
本文是LLM系列文章,针对《The Llama 3 Herd of Models》的翻译。 LLama3模型 摘要 1 引言 2 一般概述 3 预训练 3.1 预训练数据 3.1.1 网络数据管...
-
Datawhale X 魔搭 AI夏令营 Task1
Datawhale X 魔搭 AI夏令营 Task1 赛事解读 AI文生图相关概念 可图模型及微调简介 魔搭零代码生图、微调工具介绍 魔搭AI生图相关应用介绍 DataWhale开源组织网站主页:Datawhale DataWhaleAI夏令营第...
-
SD创始团队黑马的Flux真的那强吗?SD Flux与华为ultrapixel大PK!群雄逐鹿!“百模”并起,王者之战~!
前言 小南还是没忍住,看大家都在试玩Flux,真的有那么震撼么?小南手痒痒也体验下吧。今天主要简单介绍下Flux以及ComfyUI的安装,重点是和我们“遥遥领先”的华为开源的ultrapixel进行下对比。没有对比就没有伤害! 大家应该对Flux也有...
-
【AIGC】FaceChain:发挥生成式内容的无限可能性
基于图像生成的个性化肖像框架 摘要 FaceChaine提供了一系列的生成方案,通过少量的图像输入,就能生成逼真的个性化肖像。它是一个个性化肖像生成框架,包含丰富的人脸感知相关的模型,例如人脸检测,深度人脸向量提取,人脸属性分析等等。输入主要的肖像...
-
深度解析|AI绘画中SD1.5、SDXL、Checkpoint、Lora 的含义与原理
大家好,我是程序员晓晓 自接触AI绘画以来,我发现很多朋友对一些基础词汇理解地很模糊,然后在搭建ComfyUI 工作流或者使用SD WebUI进行出图时,只能知其然,不知其所以然的感觉,也不知搭选哪个模型,很多时候都是照猫画虎地模仿,很难受。而且,很多时...
-
Ai 绘画Stable Diffusion零基础入门——AI 绘画模型推荐(含二次元和真人系列)
对于一位成熟的 AI 画手而言,模型是永远不够用的。人类的绘画风格有平涂、厚涂、写实、抽象之分,而在不同的模型下,AI 对色彩、线条、光影的表达形式也不尽相同。因此,找模型是每一位 AI 画手的必修课。 基础模型 在我们入门阶段,一般接触到最多的是这两...
-
基础模型在亚马逊的BEDROCK测试
前 言 通过 Amazon Bedrock,开发者可以轻松使用多种最新领先基础模型(FM)进行构建。本实验中,您将了解和体验到在 Amazon Bedrock 中模型的基础使用方法,以便您快速构建强大安全的大语言模型(LLM)应用,其中包括:...
-
一文搞定大模型备案
《生成式人工智能服务安全基本要求》背景 1.1.基本要求对应的流程和介绍 "生成式人工智能服务安全基本要求"是针对"生成式人工智能(大语言模型)上线备案"流程制定的标准,这一流程也被称作"大模型上线备案"。这是继"生成合成(深度合成)类算法备案"之...
-
Llama中文大模型-模型微调
同时提供了LoRA微调和全量参数微调代码,关于LoRA的详细介绍可以参考论文“[LoRA: Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685 ”以及...
-
即刻体验 Llama3.1就在Amazon Bedrock!
引言 在人工智能的浪潮中,大型语言模型(LLMs)不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列,以其卓越的性能和广泛的应用前景,引起了业界的广泛关注。现在,激动人心的消息来了——Llama3.1 已经在 Amazon Be...
-
利用多Lora节省大模型部署成本|得物技术
一、背景 近期,我们在大模型集群的部署过程中遇到了一些挑战。公司有多个业务场景,每个场景都基于自身的数据进行微调,训练出相应的大模型并上线。然而,这些场景的调用量并不高,同时大模型的部署成本较为昂贵,这造成了资源的浪费。 本文将介绍我们如何利用多Lor...
-
ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货)
原文链接: ControlNet教程:无敌的Instant-ID换脸 使用方法(纯干货) (chinaz.com Instant ID 是 controlnet 比较新的一个模型,主要作用也是固定人物的面部特征。它可以仅通过一张图片进行完美换脸,可能是...
-
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
【新智元导读】AI掌握自我设计的权力,将会怎样?最近,来自UBC等机构研究人员提出了「智能体自动化设计」系统,让元智能体使用搜索算法,自动构建强大的同类。 AI训AI已经老生常谈了,那么,AI能够设计出更强的AI吗? 这不,来自UBC等机构的研究人员提出了...
-
stable diffusion深度解析|sd1.5、sdxl、checkpoint、lora 含义与原理
前言 大家好,我是Lison,接触AI绘画以来,发现很多时候对一些基础词汇理解地很模糊,然后在搭建comfyui工作流时,只能知其然,不知其所以然的感觉,也不知搭选哪个模型,很多时候都是照猫画虎地模仿,很难受。而且,很多时候,网上找不到详细地教程来详细...
-
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
刚刚,大家期待已久的 Llama 3.1 官方正式发布了! Meta 官方发出了「开源引领新时代」的声音。 在官方博客中,Meta 表示:「直到今天,开源大语言模型在功能和性能方面大多落后于封闭模型。现在,我们正在迎来一个开源引领的新时代。我们公开...
-
Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1
一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识 文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...
-
RWKV 发布中文小说模型,也擅长角色扮演!
大家好,RWKV 近期发布了 “RWKV-6-ChnNovel” 系列中文小说模型 。 相较于 RWKV-6 基底模型, RWKV-6-ChnNovel 中文小说模型在小说续写、小说扩写方面有非常好的效果。 不仅如此,使用 RWKV 小说模型进行角色扮...
-
Flux:Stable Diffusion 创始人团队再创开源 AI 巅峰之作
前言 TLDR 还记得 Stable Diffusion 吗?这款开源文本到图像生成模型,现在其部分创始成员成立了新公司 Black Forest Labs,并带来了全新的力作——Flux,一个拥有 120 亿参数的文本到图像模型,也是目前最大...
-
Datawhale X 魔搭 AI夏令营–AIGC Task1
Datawhale X 魔搭 AI夏令营–AIGC Task1 文章目录 Datawhale X 魔搭 AI夏令营--AIGC Task1 赛事介绍 文生图基础知识介绍 实践操作 step0:开通阿里云PAI-DSW试用 step1...
-
Lag-Llama 开源项目实战指南
Lag-Llama 开源项目实战指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:https://gitcode...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 Task01笔记
第一次任务比较简单,只需要配置好环境,简单运行一次 项目背景 赛题任务 可图Kolors-LoRA风格故事挑战赛 1.参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格........
-
FLUX | 超越SD3、媲美Midjourney的顶级AI绘图模型
本文包含大量AI干货 阅读完大约需要8分钟 1.引言 在过去的两年中,第一个公开发布且功能齐全的图像合成模型 Stable Diffusion 完全占据了主导地位,一大批竞争对手(PixArt Alpha/Sigma/AuraFlow)试图效仿S...
-
Stable Diffusion 亲测这几个SDXL大模型,真的非常好用!
大家好我是极客菌,前两周Stable Diffusion WebUI1.6.0发布了,新增了很多对SDXL生态的支持。 而ControlNET也对SDXL的支持也逐渐稳定。 SDXL的生态终于有一点起色了,我也觉得是时候,可以来写一篇SDXL的大模型推...
-
Datawhale X 魔搭 AI夏令营-AIGC文生图-task1-笔记
目录 1 赛题解读 2 文生图的历史 3 文生图基础知识介绍 3.1 提示词 3.2 Lora 3.3 ComfyUI 3.4 参考图控制 4 实践-通过代码完成模型微调&AI生图-Test 4.1 体验base...
-
SenseVoice多语言语音理解模型之最新部署落地经验
SenseVoice是阿里云通义实验室开发的一款多语言音频基础模型,专注于高精度多语言语音识别、情感辨识和音频事件检测。 SenseVoice支持超过50种语言的识别,并且在中文和粤语上的识别效果优于Whisper模型,提升了50%以上。 SenseV...
-
Chameleon:Meta推出的图文混合多模态开源模型
目录 引言 一、Chameleon模型概述 1、早期融合和基于token的混合模态模型 1)早期融合的优势 2)基于token的方法 2、端到端训练 二、技术挑战与解决方案 1、优化稳定性问题 2、扩展性问题 3、架构创新 4、训练技...
-
Datawhale X 魔塔 AI夏令营第四期-AIGC文生图方向 Task1笔记
一、文生图背景 文生图(Text-to-Image Generation)是一种通过文本生成图像的技术,其发展历程可以追溯到早期的计算机视觉和自然语言处理研究。文生图的概念最早出现于计算机视觉和图像处理的早期研究中。早期的图像生成技术主要...
-
Datawhale AI夏令营第四期 AIGC方向 task01小白学习笔记
本人是信安专业的在校大学生,对AIGC方向属于小白一枚,以下是本次学习的初步成果展示。 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoR...
-
LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记--切记我是一个温柔的刀客
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记 作者: 福州大学 切记我是一个温柔的刀客 2024/8/10 从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活...
-
【SD3】发布,送你3个ComfyUI工作流,轻松搞定AI绘画
这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3(简称SD3)的发布。SD3是一个多模态的 Diffusion Transformer 模型,其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。 废话不多说,先给大家看看我使...
-
Datawhale X 魔搭 AI夏令营-AIGC方向 task01笔记
目录 文生图技术的相关知识储备 SD结构图 种子 提示词 生成过程简单介绍 接下来开始随教程操作 Ⅰ开通阿里云PAI-DSW试用 Ⅱ在魔搭社区进行授权 Ⅲ报名“可图Kolors-LoRA风格故事挑战赛 Ⅳ在魔搭社区创建PAI实例编辑...
-
Stable Diffusion 模型下载:epiCPhotoGasm(真实、照片)
本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 文章目录 模型介绍 生成案例 案例一 案例二 案例三 案例四 案例五 案例六...
-
一直爆料OpenAI「草莓」的账号,竟然是个智能体?斯坦福系创企「炒作」AgentQ
当炒作出了「泼天的流量」,已经没人关心产品厉不厉害了。 最近,OpenAI 的秘密项目「Q*」一直受到了圈内人士的广泛关注。上个月,以它为前身、代号为「草莓(Strawberry)」的项目又被曝光了。据推测,该项目能够提供高级推理能力。 最近几天,关于这个...