-
美团 AIGC产品经理面经(已拿 offer)
背景:211本科毕业,毕业之后在北京一家中型电商公司做了3年商家后台产品经理,目前通过老薛的朋友关系拿到了美团的offer。 目前还有几家在面试流程中,继续加油? 美团AIGC产品面经-业务面 ?1、自我介绍(每次面试必问)。 ?2、在做XX智...
-
Datawhale AI 夏令营【AIGC文生图】
Datawhale AI 夏令营----AIGC文生图 一、赛事介绍 1、背景知识 2、比赛任务 3、文生图简介 4、数据集介绍 二、Task1 baseline解析 1、导入相关库 2、数据集处理 3、保存数据 4、训练模型,查看训练脚...
-
【LLM模型微调】LLMs-微调经验-LLaMA微调指南v7.0
【导读】:本文是LLM模型微调第七篇,分享Meta于20240807的开源三篇文章:Methods for adapting large language models,To fine-tune or not to fine-tune,How to fin...
-
OpenAI GPT-3 Davinci:引领AI写作新纪元
本文还有配套的精品资源,点击获取 简介:OpenAI研发的GPT-3模型,尤其是其Davinci版本,代表了自然语言处理领域的重大突破,具有1750亿参数,提升了AI在理解和生成语言的能力。GPT-3的Davinci版本以顶级性能著称,在多种语...
-
中国版“Scale AI” 蚂蚁数科发布 AI 数据标注产品
提高数据数量、安全和多样性,对提升大模型性能,推动产业落地至关重要。记者从2024Incluison·外滩大会上了解到,蚂蚁数科发布新一代数据标注产品,向企业客户提供AI 驱动的全流程数据服务。 传统数据标注以人工为主,进入大模型时代,企业面对数据指数级增...
-
Llama-factory的yaml配置参数--学习记录
最近llama-factory的配置参数有很多不懂的地方,整理了一些但也有可能有错,仅供大家参考。 # 可选参数 # 模型和适配器相关 --adapter_name_or_path # 描述: 适配器的名称或路径。 --adapter_folder...
-
第三十五篇-各大模型测评地址和说明集合
1.Open LLM Leaderboard - 开放式LLM排行榜 测评地址:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard 说明:使用Eleuther...
-
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面...
-
Datawhale X 魔搭 AI夏令营AIGC方向task2
第一步:安装 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...
-
AIGC入门(二)从零开始搭建Diffusion!(下)
上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程(ForwardProcess.py) 当我们的去噪器设计完成后,接下来,就...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
使用PyTorch从零构建Llama 3
我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后,有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了,本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。 [图1]:Llama...
-
FLUX 1 将像 Stable Diffusion 一样完整支持ControlNet组件
之前 InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro 该模型支持 7 种控制模式,包括 canny...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
AIGC初体验 Datawhale X 魔搭夏令营
跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
DataWhale夏令营第四期魔搭- AIGC方向 task02笔记#Datawhale AI夏令营
Task2:精读代码,实战进阶 聊聊相关:虽然现在很多的AI绘图都能被大家说“一眼鉴AI”,但随着技术日新月异的变化,我们也需要掌握辨识和判别他的能力。 Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实...
-
震撼发布!阿里通义FunAudioLLM:重塑自然语音交互新纪元,开源引领语音处理革命!
近年来,人工智能的进步如 GPT-4o 和 Gemini-1.5极大地改变了人与机器的互动方式,2023这种转变在语音处理领域尤为明显。 阿里巴巴通义实验室近日发布并开源了 FunAudioLLM,这是一个旨在增强人与大型语言模型(LLMs)之间...
-
CVPR`24 | 又快又好!渲染速度比ENeRF快30倍!4K4D:实时4K分辨率4D视图合成
文章链接:https://arxiv.org/pdf/2310.11448 git链接: https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近,一些动态视图合成方法在渲染质量方面...
-
python从入门到精通:基础语法讲解
1、字面量 字面量:在代码中,被写下来的固定的值,称之为字面量。 python中常用的几种数据类型: 类型 描述 说明 数字(Number) 整数(int) 浮点数(float) 复数(complex) 布尔(bool) 整数(int)...
-
基于大模型的原神对话系统尝试
一.简介 该项目为一次大模型+游戏的尝试,成功实现了一个与原神内角色的对话系统。 演示视频:https://www.bilibili.com/video/BV1b48CeuELL github地址:https://github.com/goodlu...
-
WebLlama 项目使用教程
WebLlama 项目使用教程 webllamaLlama-3 agents that can browse the web by following instructions and talking to you项目地址:https://gitcod...
-
Datawhale X 魔搭 AI夏令营 第四期AIGC_task03笔记
工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"(图形用户界面)的缩写,简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种,是...
-
Datewhale AI夏令营第四期 AIGC方向Task1笔记
①文生图基基础知识: ✔提示词:主体描述,细节描述,修饰词,艺术风格,艺术家 ✔Lora模型:实现对特定主题、风格或任务的精细化控制 ✔ComfyUI:模型微调、数据预处理、图像生成 ✔参考图控制:openp...
-
Stable Diffusion Web UI基础入门之常用参数
在之前的文章中我们介绍了,Stable Diffusion的基础知识和使用工具———Stable Diffusion AI入门介绍。这篇文档带大家了解一下Stable Diffusion Web UI的常用参数,在日常绘图中如何使用。 我们知道在St...
-
陶哲轩力荐,哈佛反向学习法火了:教会AI就是教会自己
数学大佬陶哲轩力荐,哈佛反向学习法火了:教会AI就是教会自己。 他最新分享了哈佛应用数学和应用物理学教授Michael P. Brenner的一个教学方法—— 利用提示工程,让学生尝试教AI完成平时数学作业(不纳入正式考核),期末再让这些AI参加考试。...
-
基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat
本文旨在探讨基于Llama factory使用LoRA(Low-Rank Adaptation)技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程,重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...
-
记录Linux上安装LLaMA Factory v0.8.3 增量预训练/监督微调
序:SFT 和 PT 的区分 sft(Supervised Fine-Tuning,监督微调) 定义:sft是一种基于监督学习的微调方法,它使用标记好的数据(即带有输入、指令和期望输出的数据集)来进一步训练已经预训练好的模型。这种方法允许模型...
-
基于AIACC加速器快速实现Stable Diffusion生成特定物体图片
本文介绍如何使用GPU云服务器搭建Stable Diffusion模型,并基于ControlNet框架,快速生成特定物体图片。 背景信息 Stable Diffusion(简称SD)是一种AI模型,它经过训练可以逐步对随机高斯噪声进行去噪以生成所需要的...
-
llama.cppllama.cpp 是一个C++库,用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现,不依赖任何外部库,并且针对x86架构提供了AVX、
llama.cpp llama.cpp - Qwen llama.cpp 是一个C++库,用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现,不依赖任何外部库,并且针对x86架构提供了AVX、AVX2和AVX5...
-
Stable Diffusion模型训练:从数据准备到模型优化
Stable Diffusion模型训练:从数据准备到模型优化 开篇引入:探索创意无限的Stable Diffusion 数据集构建秘籍:打造专属训练素材 如何收集高质量图像数据? 数据预处理小技巧:清洗与标注 模型配置与训练实战:让创意流...
-
Datawhale X 魔搭 AI夏令营第四期AIGC方向笔记task3
part1:工具初探一ComfyUI应用场景探索 初识ComfyUI 什么是ComfyUI GUI 是 "Graphical User Interface"(图形用户界面)的缩写。简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的...
-
一文看懂llama2(原理&模型&训练)
一文看懂Llama2(原理&模型&训练) 一、引言 Llama2是Meta(原Facebook AI)最新开源的大型语言模型,它基于Transformer架构进行了多项优化和改进,旨在提供更高效、更准确的自然语言处理能力。Llama2...
-
服务器部署llama3 并利用LLaMA-Factory实现微调
llama3的编译环境要求: 需要的软件,硬件资源: python=3.11 pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.2 第一步下载需要的pytho...
-
【大模型理论篇】关于LLaMA 3.1 405B以及小模型的崛起
前不久,Meta开源了LLaMA 3.1 405B【1】,模型扩展了上下文长度至 128K,支持八种语言,效果非常惊艳,是首个在通用知识、可操控性、数学、工具使用和多语言翻译方面能够与最先进闭源 AI 模型媲美的公开可用模型,已经赶上截至目...
-
Meta最新SAM2模型开源直接封神
2024年7月29日,Meta在官网发布SAM2开源消息:segment-anything-2 开源地址:https://github.com/facebookresearch/segment-anything-2 paper:sam-2-seg...
-
PonyXL 图像生成指南
为每个模型逐一编写描述变得越来越烦人。因为我的设置,即提示语写作风格、提示语本身等,正在不断变化,最佳设置始终保留在我最新的模型中,而这些设置对于那些将旧模型视为新的人来说就像宇宙中的一颗原子。这就是为什么我将编写一篇指导文章,并将此文章的链接提供给我的模...
-
一周打完1000场官司,中科院发布首个AI法庭AgentCourt
在人工智能重塑各个行业的今天,法律界也迎来了前所未有的变革。传统的法律实践面临着效率低下、成本高昂等挑战,而AI技术的出现为解决这些问题提供了新的可能。 从最初斯坦福小镇火遍全网,25个由大语言模型(LLMs)驱动的智能体生活交友,打开了多Agent新视角...
-
让AI更懂物理世界,人大北邮上海AI Lab等提出多模态分割新方法
让AI像人类一样借助多模态线索定位感兴趣的物体,有新招了! 来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下...
-
DataWhaleX魔搭夏令营第四期AIGC方向task01笔记
从零入门AI生图原理&实践是Datawhale AI 夏令营(第四期)“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 在task01中,我们主要在魔搭社区搭建PAI实例并体验一下baselin...
-
AIGC大模型产品经理高频面试大揭秘‼️
近期有十几个学生在面试大模型产品经理(薪资还可以,详情见下图),根据他们面试(包括1-4面)中出现高频大于3次的问题汇总如下,一共32道题目(有答案)。 29.讲讲T5和Bart的区别,讲讲Bart的DAE任务 T5(Text-to-Text Tr...
-
DataWhale多模态赛事Task1
赛事链接:https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述:在当下大数据、大模型时...
-
AIGC-视频生成-AnimateDiff-基于T2I模型的动态生成论文详细解读
AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning 代码:https://github.com/guoyww/a...
-
从困境到突破,EasyMR 集群迁移助力大数据底座信创国产化
在大数据时代,企业对数据的依赖程度越来越高。然而,随着业务的不断发展和技术的快速迭代,大数据平台的集群迁移已成为企业数据中台发展途中无法回避的需求。在大数据平台发展初期,国内数据中台市场主要以国外开源 CDH、商业化 CDP、HDP 为主。然而,由于国际形...
-
探索Llama 3.1 : 405B参数模型:部署、硬件配置、测试与训练的心得
引言 随着人工智能技术的快速发展,大规模语言模型(Large Language Models, LLMs)在自然语言处理(NLP)领域取得了显著的突破。MetaAI最新发布的Llama 3.1 : 405B参数模型,凭借其庞大的参数规模和先进的架构,展...
-
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task3笔记
①初识ComfyUI 1.GUI是“图形用户界面”(Graphical User Interface)的缩写。它是一种使用图形元素如图标、按钮和窗口等来帮助用户与软件或操作系统进行交互的用户界面类型。通过GUI,用户可...
-
【AIGC】训练数据入库(Milvus)
之前的文章有写如何获取数据、如何补充数据,也有说如何对数据进行清洗、如何使用结构化数据进行训练。但好像没有说如何将训练数据“入库”。这里说的入库不是指 MySQL 数据库,而是指向量检索库 Milvus。 众所周知,人工智能多用向量数据进行训练。数据先做...
-
异常检测算法在可观测性平台的落地和实践|得物技术
一、背景 在稳定性保证中,重要的一个环节就是故障管理体系建设,故障管理体系的四大核心功能------故障发现、故障触达、故障定位和故障恢复,其中故障发现作为故障管理的第一步至关重要,包含了指标预测、异常检测和故障预测等方面,主要目标是能及时、准确地发现故...
-
Datawhale X 魔搭 AI夏令营 第四期--AIGC文生图 task2笔记
先上图看连环画成果 一直有个篮球总冠军,根据通义千问的文生图对话式生成8个连贯的文生图故事。通过生成的故事内容生成了下面的图片 男主正在练习打篮球 动漫风,连环画,一个黑色高个子帅气男生,穿着红色篮球服,正在篮球训练场上,练习投篮,专注地重复...