-
AI绘画又有好玩的了,玩转FLUX,手和文字不再是问题了!
Prompt: Extreme close-up of a single tiger eye, direct frontal view. Detailed iris and pupil. Sharp focus on eye texture and col...
-
AIGC辅助办公
1.什么是AIGC? 早期内容生成方式为专业(人士 生成内容(Professional Generated Content,PGC 。 如:音乐专业人士的创作、设计师的平面设计创作 用户生成内容(User Generated Content,UGC 更...
-
llama factory运行deepspeed zero3产生stage3_prefetch_bucket_size Input should be a valid integer的解决方案
大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客...
-
Intel首批通过AISBench大模型性能测试!5代至强可达每秒2493 token
快科技9月5日消息,近日,第五代英特尔至强处理器,以优秀的表现通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试(AISBench)。 借此,英特尔也成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。 在AISBench 2....
-
AI绘画SD教程 | StableDiffusion像素风格绘制,轻松制作复古怀旧像素游戏画面风格,保姆级教程带你快速入门!
大家好,我是画画的小强 像素风设计一直是一股潮流,现在有了AI绘画工具Stable Diffusion,画像素画从来没有这么简单。今天我就教你如何用SD画出好看的像素画,无论是用来做头像还是设计素材甚至用来当做游戏动画资产都可以。 01、理解像素风格...
-
蚂蚁数科CEO赵闻飙:大模型不是产业数字化的唯一解
“过去一年,蚂蚁数科客户数增长35%。旗下多个产品取得所属赛道市场份额第一。”9月5日下午,蚂蚁数科CEO赵闻飙在外滩大会媒体交流会上透露。这是自今年3月份蚂蚁数科独立化运营后,赵闻飙首次对外公布公司的业务进展及战略布局。 赵闻飙还透露,出海是蚂蚁数科的重...
-
Prompt-hunter:一键保存Midjourney细节页面至Notion的高效工具
Prompt-hunter:一键保存Midjourney细节页面至Notion的高效工具 Prompt-hunterSave the Prompt and images from the Midjourney details page to your...
-
国内首个!端到端语音大模型心辰Lingo在外滩大会正式发布上线
9月5日,在外滩大会“大模型的创造力边界与应用想象力”论坛上,大模型创业企业西湖心辰正式发布并上线国内首个端到端语音大模型“心辰Lingo”。 “心辰Lingo”实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信...
-
视频化时代,用好AIGC产品赋能企业培训打造增效降本“最佳实践”
根据IBM的数据,85%的中国企业正在加速投资AI领域,其中超过63%的企业已积极采用生成式AI。德勤的调研进一步显示,近80%的全球受访企业高管认为,生成式AI的兴起与发展将在3年内推动组织和行业发生实质性变革,这也就意味着,企业如果不积极拥抱AI,很可...
-
stable Diffusion 网页用户界面 github
稳定的 Diffusion 网页用户界面 使用 Gradio 库实现的稳定扩散的 Web 界面。 特征 带有图片的详细功能展示: 原始的 txt2img 和 img2img 模式 一键安装并运行脚本(但您仍然必须安装 pyth...
-
107 深入解析Llama Index的响应合成器 llamaindex.core.response_synthesizers.facotry.py
深入解析Llama Index的响应合成器 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的一个关键组件——响应合成器(Response Synthesi...
-
Stable Diffusion WebUI 使用ControlNet:IP-Adapter保持生图的角色一致性
IP-Adapter-FaceID可以在保持人脸一致的条件下生成各种风格的图像。 下载 IP Adapter 需要的 Face ID 模型和 Lora 下载地址:https://huggingface.co/h94/IP-Adapter-FaceID/...
-
了解BitWhisper窃密技术:跨越气隙的隐秘数据窃取手段
在网络安全领域,气隙(Air-Gap)被视为保护敏感数据的终极防线。通过将计算机或网络物理隔离,使其无法连接到其他网络(尤其是互联网),气隙被广泛应用于保护极为敏感的信息,如军事指挥系统、金融系统、以及工业控制系统。然而,近年来出现了一种名为BitWhis...
-
Midjourney提示词-动物系列-71
cute little crocodile walking, tiny, happy, smiling sun is shinning, grass fields, apple tree in the background, sharp focus, ar...
-
HID-Joy-Con-Whispering 项目使用教程
HID-Joy-Con-Whispering 项目使用教程 HID-Joy-Con-WhisperingTalk to Joy-Con from a PC because it's cool项目地址:https://gitcode.com/gh_mir...
-
支付宝开放生态进入AI时代,推出智能体开发平台“百宝箱”
9月5日,继面向用户推出AI生活管家App“支小宝”后,支付宝面向行业正式启动智能体生态开放计划,并推出智能体开发平台“百宝箱”。依托专业的智能体构建能力,商家机构可0代码、最快1分钟创建专属智能体,并一键发布到支付宝小程序、支付宝App、支小宝App等。...
-
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南
Lag-Llama:时间序列预测的开源基础模型中文安装与使用指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:h...
-
AI绘画:从零开始教你玩转ComfyUI-保姆级部署教程-手把手带你ComfyUI工作流搭建!
前言 第一节:认识ComfyUI并安装 本教程专为初学者设计,详细介绍了 2024 年最新版的SD ComfyUI的使用方法。通过逐步指导,让你无需任何基础,快速学会并使用这一强大的AI绘图工具。 1、什么是comfyui ComfyUI就像...
-
外滩大会显露AI产业实践六大趋势 下一代超级应用是智能体
9月5日,2024·Inclusion外滩大会在上海开幕。AI产业的发展是本届外滩大会与会专家和企业家热议的话题,无论是企业界的实践,还是专家学者的研究,各方都认为AI产业实践正呈现六大趋势,涵盖小模型、智能体、专业AI、具身智能等方面,指明了大模型产业落...
-
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面...
-
阿里云创始人王坚:AI 不是AI和产业简单结合
快科技9月5日消息,今日,2024Inclusion外滩大会在上海开幕,本次外滩大会预计将有几十项行业革新产品、标准和研究报告亮相。 在开幕式主论坛上,中国工程院院士、之江实验室主任、阿里云创始人王坚分享了他对AI、AI 和AI基础设施的思考。 他指出,A...
-
深度剖析Google黑科技RB-Modulation:告别繁琐训练,拥抱无限创意生成和风格迁移!
给定单个参考图像,RB-Modulation提供了一个无需训练的即插即用解决方案,用于(a 风格化和(b 具有各种提示的内容样式组合,同时保持样本多样性和提示对齐。例如,给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ,RB...
-
CoralStyleCLIP(图像编辑的协同优化区域)个人理解
一、CoralStyleCLIP介绍 论文:CoralStyleCLIP: Co-optimized Region and Layer Selection for Image Editing 论文内容:本文提出了CoralStyleCLIP,它在Sty...
-
AI日报:Claude企业版上线;支付宝外滩大会将推支小宝等3款AI产品;Soul语音大模型惊艳到我了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Anthropic发布企业版A...
-
Prompt | 自定义 Kimi Copilot 提示词
昨天的文章有提到 Kimi Copilot 支持自定义提示词(Prompt),今天简单的介绍下如何自定义 Kimi Copilot 提示词。顺便说一下,今天 Kmit Copilot 版本更新了,默认提示词总结的内容太繁琐了,我还是喜欢比较简洁的总结,所以...
-
2024外滩大会开幕:互联网教父凯文·凯利发布AI时代三大预测
快科技9月5日消息,今天上午,2024Inclusion外滩大会在上海开幕,《连线》杂志创始主编、《5000天后的世界》作者凯文凯利(KevinKelly)发表了演讲。 他认为当人工智能深刻影响经济和文化,将涌现三大趋势:全球主义、创新加速和AI驱动生成。...
-
使用 Llama-Agents、Qdrant 和 Kafka 进行高级实时 RAG
简介 在当今数据驱动的世界中,实时处理和检索信息的能力至关重要。本文深入探讨了使用Llama-Agents、Qdrant 和 Kafka 的高级实时检索增强生成 (RAG 。通过集成这些强大的工具,我们创建了一个可以有效管理数据提取、处理和检索的代理系...
-
蚂蚁集团将在外滩大会发布三款AI新产品
9 月 5 日上午,蚂蚁集团总裁韩歆毅在2024Inclusion外滩大会透露,本届大会蚂蚁将发布三款AI新产品,包括由支付宝全新推出的AI独立App支小宝。过去两年,蚂蚁以支付宝为核心加速AI应用布局,已在出行、政务、医疗、理财等场景服务亿级用户。韩歆毅...
-
ComfyUI 实战教程:图片添加文字
大家好,我是每天分享AI应用的萤火君! 在AI绘画中书写文字一直是个老大难的问题,直到SDXL的出现,文字生成才迎来转机,可以在提示词中指定一些英文字符,不过也是经常出错,生成中文就更加不可求了。 本文介绍一种在AI生成图片中稳定生成文字的方法,可以自...
-
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天...
-
沈向洋外滩大会分享:人工智能的颠覆性力量逐步显化,须打造负责任的AI
“今天大模型带来的震撼,有多少是来自人机交互、又有多少是来自机器智能的进步?”9月5日,在上海举办的2024Inclusion·外滩大会开幕式主论坛上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在题为《大模型时代的机遇和挑战:技术融合,产业跃迁》...
-
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低 50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。 在腾讯...
-
国漫女神:完美世界 肤白貌美 大长腿 月婵仙子 绘画 二次元ai绘画
完美世界:月婵仙子绝美壁纸 如果你喜欢我的推文,可以将“”添加为“设为星标”。 精准推送国漫女神美图,每一期都为了呈现绝美的国漫小娇羞~ 在完美世界中,月婵仙子是一个令人着迷的角色,她的故事充满了奇幻和浪漫的元素。月婵仙子,拥有着绝世的美貌和卓越的实...
-
RWKV 已部署到 5 亿台 Windows 电脑?真正开源的新一代 AI 架构
2024 年 9 月 ,RWKV 社区成员发现:Office 系统在自动更新后(版本 2407 及以后)已自带 RWKV 运行库。 在 Windows 系统的 C:\Program Files\Microsoft Office\root\vfs\Pro...
-
Datawhale X 魔搭 AI夏令营AIGC方向task2
第一步:安装 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...
-
制造AI分身,能让内容博主们躺着赚钱吗?
当内容博主陷入倦怠期,怎么办? YouTube博主Kwebbelkop使用的办法是,制作自己的AI分身,自2023年年底开始替代自己,自动创作视频内容,为观众讲解游戏玩法,也让他成为了最早拥抱AI的创作者之一。 YouTube博主“Kwebbelkop...
-
AIGC入门(二)从零开始搭建Diffusion!(下)
上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程(ForwardProcess.py) 当我们的去噪器设计完成后,接下来,就...
-
凯文·凯利外滩大会分享对AI时代前瞻:“全球化劳动力”将首次出现
9月5日上午,2024Inclusion·外滩大会在上海黄浦世博园区开幕。著名未来学家、《连线》杂志创始主编、《5000天后的世界》作者凯文·凯利(KevinKelly)在开幕主论坛上的演讲中指出,当人工智能深刻影响经济和文化,必将涌现三大趋势:全球主义、...
-
AI写作加速器,⌈ 橙篇 ⌋ 10 分钟让你的万字长文一气呵成!
大家好,我是凡人。 最近让兄弟烦的够呛,他听说一直在研究AI技术,接连几天打电话,让我帮他写一定得搞一个帮助学生研究中国稀有植物的论文样本,论文字数不能少于8000字,这周五就要,我艹这不就周五了么,头疼呀! 就在正准备用Kimi+的长文生成器...
-
2024外滩大会开幕:全球科技巨头共话金融与AI未来
2024年9月5日,2024nclusion·外滩大会在上海黄浦世博园区正式开幕。大会以“科技·创造可持续未来”为主题,旨在推动国际交流,融合科技与人文,助力上海打造全球影响力的国际金融与科技创新中心。 本届外滩大会汇聚了10余位中外院士和500多位行业...
-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
超级Prompt:几行乱码让大模型获得科学思维,这个神奇的提示词突然火了
起猛了?不过两三天的时间,仅有两个 Markdown 文件的 GitHub 项目为何竟能收获2k star? 仔细一看,其中一个 Markdown 文件是一个流程图,另一个 Readme 文件的主要内容则是一大篇大模型提示词(prompt。而如果你细读这...
-
本地搭建Stable Diffusion,文生图再也不用求别人了!
前言 本地搭建Stable Diffusion,文生图再也不用求别人了 1. 简介 Stable Diffusion 是一种深度学习模型,用于生成高质量的图像。它基于一种名为扩散过程的生成方法,能够在给定条件的情况下生成具有丰富细节的图像。...
-
真把自己「当个人」的AI,扫去了我的社交贫困
现代打工人,时常会因为「社交贫困」而四处碰壁,无心工作时不知找谁聊天,讨论气氛热烈时语出惊人,开口就能终结话题,周末出去玩发了朋友圈,后来发现也没有人点赞。 总之一进入社会,就感受到了世界的参差。最近这些尴尬无助的场景,全都有了解决方案。 我们刷到一段聊天...
-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛?:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...
-
专为Windows 11 AI PC打造!高通推出全新骁龙X Plus 8核平台
快科技9月4日消息,高通公司总裁兼CEO安蒙在柏林国际电子消费品展览会(IFA)前夕,宣布扩展骁龙X系列产品组合,助力OEM推出700-900美元价格段的Windows 11 AIPC产品。 官方介绍,骁龙X Plus 8核平台凭借定制的高通Oryon C...
-
使用PyTorch从零构建Llama 3
我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后,有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了,本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。 [图1]:Llama...
-
如何在复杂对话中准确识别每位说话人的声音?OpenAI Whisper系统带来新突破,尽管在面对重叠声音时仍需进一步优化。
在复杂对话中准确识别每位说话人的声音是一个挑战,尤其是在面对重叠声音的情况下。OpenAI的Whisper系统虽然在自动语音识别(ASR)方面取得了显著进展,但在处理重叠声音时仍需进一步优化。 Whisper系统通过利用大规模预训练模型和弱监督学习来提取...
-
FLUX 1 将像 Stable Diffusion 一样完整支持ControlNet组件
之前 InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro 该模型支持 7 种控制模式,包括 canny...
-
WhisperX: 带时间戳的自动语音识别及说话人分离
WhisperX: 带时间戳的自动语音识别及说话人分离 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,...