-
谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐
11 月 21 日消息,Deepmind 日前推出了一款名为 Lyria 的音频模型,可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作,整合 Lyria 模型开发了音乐创作工具 Dream Track,声称可令...
-
【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家
目录 前言 1 使用HAI服务作画的步骤 1.1 注册腾讯云账户 1.2 创建算力服务器 1.3 进入模型管理界面 1.4 汉化界面 1.5 探索AI绘画 2 模型参数的含义和调整建议 2.1 模型参数的含义和示例 2.2 模型参数的调整...
-
AI「cosplay」关键在人设!复旦、人大等发布大五人格+MBTI测试:特质还原率达82.8%,拒绝OOC
想和喜欢的动漫小说角色聊天?想要一个虚拟伴侣?想要自己的数字智能体? 随着大语言模型(Large Language Models, LLM)的发展,这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...
-
GenAI时代的数据治理蓝图
随着我们深入ML和GenAI领域,对数据质量的重视变得至关重要。KMS Technology高级技术创新小组的首席技术官John Jeske深入研究了数据治理方法,如数据沿袭跟踪和联合学习,以确保顶级模型的性能。 数据质量是模型可持续性和利益相关者信...
-
AI视野:奥特曼重回OpenAI;魔搭社区推出开源版GPTS;谷歌Bard遭遇提示注入攻击;Meta重组并解散AI监管团队
???AI新鲜事 反转!奥特曼重回OpenAI 据报道,OpenAI 前 CEO Sam Altman与前总裁Greg Brockman在 OpenAI 旧金山总部与公司高管会面。微软和其他投资人正在努力恢复Sam Altman的职位。 Emmett...
-
真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像
最近一年来,以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提升生产力。但是,扩散模型的生成速度是一个老生常谈的问题。因为降噪模型依赖于多步降噪来逐渐将初始的高斯噪音变为图片,因...
-
智能自动化:当计算机视觉、人工智能和AR集成时
智能自动化是一个相当新的概念,各行业尚未与其业务整合。 本文讨论了构成智能自动化的几个关键点。 对于开发人员而言,最有前途的技术是增强现实(AR 、虚拟现实(VR 和人工智能(AI 。虚拟现实(VR 是由游戏玩家为游戏玩家开发的,主要用于游戏和娱乐,而...
-
复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...
-
「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR
多模态对比表示(multi-modal contrastive representation, MCR)的目标是将不同模态的输入编码到一个语义对齐的共享空间中。 随着视觉-语言领域中CLIP模型的巨大成功,更多模态上的对比表征开始涌现出来,并在诸多下游任...
-
SDXL-Stable Diffusion改进版
文章目录 1. 摘要 2. 算法: 2.1 结构: 2.2 微小的条件机制 2.3 多宽高比训练 2.4 改进自编码器 2.5 所有组合放到一起 2.6 主流方案比较 3. 未来工作 4. 限制 论文: 《SDXL: Improv...
-
BeautifulPrompt:PAI 推出自研 Prompt 美化器,赋能 AIGC一键出美图
背景 Stable Diffusion(SD)是一种流行的AI生成内容(AI Generated Content,AIGC)模型,能在文字输入的基础上生成各种风格多样的图像。在目前的AIGC方向,SD是开源社区最热门的模型。然而,SD能够生成高颜值的图像...
-
Midjourney用户手册中文版详解模型、命令、参数与高级用法
最近正在上手体验目前网上很火的 AI 绘画工具 Midjourney,在B 站上找了很多教程来看,现在基本可以上手用它生成很多好玩的图片了。 • Midjourney 入门教程:Midjourney零基础入门指南!小白轻松上手...
-
大模型「幻觉」,看这一篇就够了
大模型“幻觉”,终于有系统综述了! 一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。 这篇最新综述来自哈工大和华为,一po出就在网上火得不行: 具体来说,文中用一套新的范畴框架来定义模型幻觉,并将其分为事实性幻觉、...
-
让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入
AI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。 现在,清华大学联合HuggingFace的研究人员,推出了全新的绘图模型加速模块。 作者给出的体验版当中,点击生成按钮后,模型只用了几秒钟就绘制出了4张清晰的图像。...
-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
kafka个人笔记
大部分内容源于https://segmentfault.com/a/1190000038173886, 本人手敲一边加强印象方便复习 消息系统的作用 解耦 冗余 扩展性 灵活性(峰值处理 可恢复 顺序保证 缓冲 异步 解耦:扩展两边处理过程,只需...
-
亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer,开发快人一步!
近年来,随着 AI 技术的进步、基础设施建设的不断完善,AI 应用场景不断丰富,各类 AI 产品和工具层出不穷。其中,面向开发者的 AI 编程工具也在不断迭代,并因宣称能“帮开发者写代码”而引发关注。目前,可以为开发者提供编程建议的常用工具大致有两类:一类...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
SymphonyAI发布突破性AI金融犯罪调查案例管理平台
SymphonyAI Sensa-NetReveal日前宣布推出Sensa Investigation Hub,这是亚太地区首个高影响力的AI变革金融犯罪调查和检测平台。该平台利用先进的预测和生成式AI技术,结合全球领先的风险和合规专业知识,为金融机构提供...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
大模型幻觉排行榜GPT-4夺冠,英伟达科学家强力打假!Meta版ChatGPT一作发长文鸣冤
大模型的幻觉问题,是业内老生常谈的话题了。 最近,一个名为Vectara的机构,在GitHub推出了一个大模型幻觉排行榜。 结果显示,在总结短文档方面,GPT-4的表现最为优异,而Google Palm的两款模型直接垫底! 其中GPT-4的准确率为97...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
如何测试生成式人工智能(AIGC)
简介:在人工智能日趋普及的今天,生成式人工智能(AIGC)已经成为不可忽视的一个分支。从自动化生成新闻、编写代码到图像和音频生成,AIGC几乎无处不在。但如何确保这些生成的内容达到预期标准、安全可靠,同时又具有高度的可用性呢?这是一个值得细细思考的问题。...
-
如何构建新一代实时湖仓?袋鼠云基于数据湖的探索升级之路
在之前的实时湖仓系列文章中,我们已经介绍了实时湖仓对于当前企业数字化转型的重要性,实时湖仓的功能架构设计,以及实时计算和数据湖结合的应用场景。 在本篇文章中,将介绍袋鼠云数栈在构建实时湖仓系统上的探索与落地实践,及未来规划。 数栈为什么选择实时湖仓...
-
第四节 如何使用Midjourney工具完成图生图
正在上一节课中,我们学会如何使用MJ生成一张自己喜欢的图片,我们可以称其为文生图,既利用文字描述来生成一张图片。但是,文生图有个致命的缺陷就是随机性太强,你无法预料MJ生成的图片将会是怎么样的,运气好的话第一次生图就能得到满意的照片,运气不好可能要一直刷新...
-
stable diffusion图片转图片(教程)
图片转图片# 一般我们有两种途径对图像进行修复:PS 和 InPaint,使用方法也十分多样。 WebUI 使用 --gradio-img2img-tool color-sketch 启动会带入一个插件对图片进行颜色涂抹(这里不是 Inpaint ...
-
大模型幻觉率排行:GPT-4 3%最低,谷歌Palm竟然高达27.2%
人工智能发展进步神速,但问题频出。OpenAI 新出的 GPT 视觉 API 前脚让人感叹效果极好,后脚又因幻觉问题令人不禁吐槽。 幻觉一直是大模型的致命缺陷。由于数据集庞杂,其中难免会有过时、错误的信息,导致输出质量面临着严峻的考验。过多重复的信息还会...
-
NeRF与自动驾驶的前世今生,近10篇论文汇总!
神经辐射场(Neural Radiance Fields)自2020年被提出以来,相关论文数量呈指数增长,不但成为了三维重建的重要分支方向,也逐渐作为自动驾驶重要工具活跃在研究前沿。 NeRF这两年异军突起,主要因为它跳过了传统CV重建pipeline的...
-
Midjourney推出5.2版本,更新zoom out功能
Midjourney是一款专业的图像处理软件,它可以让用户轻松地创造出高质量的图像。它最近宣布推出了5.2版本,这是一个重大的更新,其中最亮眼的功能就是zoom out功能。 zoom out功能可以让用户无限地缩小原始图像,同时保持图像的清晰度和细节不...
-
UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了
GPT-4V诞生后,惊艳的多模态能力让网友惊呼连连,连OpenAI总裁Greg Brockman都不断在X上安利。 不过,最近大家发现,只要打乱布局,GPT-4V就会被曾经解决的著名计算机视觉难题——「吉娃娃还是松饼」,再次难倒…… UCSC教授Xin...
-
Stable Diffusion - 扩展 Roop 换脸 (Face Swapping) 插件的配置与使用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131856141 官网:GitHub - roop,参考论文:Ro...
-
AI视野:Runway推新功能运动笔刷;iPhone16将引入生成式AI;百度AI编程工具限时免费;元象大模型向全社会开放
???AI新鲜事 Runway推新功能运动笔刷 随手一涂静图变动图 Runway推出的新功能「运动笔刷」让Gen-2视频生成工具再次颠覆AI圈,摆脱文字依赖,手势操作即可赋予静态图片动感,创造可控制生成内容的新方法。 苹果计划在iPhone16上推出i...
-
文心一言4.0内测入口 文心一言新版本有哪些功能
百度文心一言4.0版本现在已经可以申请测试,4.0版本效果全面升级,能更好地帮助您的工作和生活,同时每3小时内畅享100次问答,这里我们来看下文心一言4.0版本的申请入口。 文心一言4.0(点击进入)是百度最新推出的一款人工智能大模型,它可以在多个场景和...
-
图像涂哪就动哪!Gen-2新功能“神笔马良”爆火,网友:急急急
AI搞视频生成,已经进化到这个程度了?! 对着一张照片随手一刷,就能让被选中的目标动起来! 明明是一辆静止的卡车,一刷就跑了起来,连光影都完美还原: 原本只是一张火灾照片,现在随手一刷就能让火焰直冲天际,热度扑面而来: 这样下去,哪还分得清照片和实...
-
【AI绘画】Stable Diffusion WebUI
???欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学习,不断总结,共同进步,活到老学到老 导航 檀越...
-
Stable Diffusion Web UI
Stable Diffusion Web UI 是一个基于 Stable Diffusion 的基础应用,利用 gradio 模块搭建出交互程序,可以在低代码 GUI 中立即访问 Stable Diffusion Stable Diffusion...
-
一个平台搞定数据治理,让数据资产发挥价值
根据北京研精毕智信息咨询发布的调查报告,2018-2021年,全球数据存储量由30ZB上升至55ZB左右,年平均增长率约为27.8%。到2022年,数据总存储量进一步增加至65ZB以上,较2021年同期新增了约10ZB,同比增长18.2%。各市场主体对数据...
-
【Claude2体验】继ChatGPT,文心一言,Bing等大模型后,初次对话Claude2的体验
文章目录 ?注意事项 ?什么是Claude2 ⭐与之前版本的进步 ?官网的讲解 ?功能介绍 ?使用体验 ?查看不知道如何才能打开的文档 的内容 ?日常需求 ✨Claude ✨ChatGPT3.5 ?总结 ?专栏【小吉测评...
-
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单
在现代社会,信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中,同样也是机器理解世界所必须面对的挑战。 如何让机器像人类...
-
python爬虫入门教程(非常详细)
1、什么是爬虫 爬虫指的是一种自动化程序,能够模拟人类在互联网上的浏览行为,自动从互联网上抓取、预处理并保存所需要的信息。 爬虫运行的过程一般是先制定规则(如指定要抓取的网址、要抓取的信息的类型等),紧接着获取该网址的HTML源代码,根据规则对源代码进...
-
Midjourney的--seed 解释,并附有例子
探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...
-
文生图大型实践:揭秘百度搜索AIGC绘画工具的背后故事!
作者 | Tianbao 导读 2023年以来,AIGC技术已催生了新一轮人工智能浪潮。AI绘画作为大模型最引人瞩目的应用领域之一,近年来也取得了重大突破。AI绘画系统可以根据用户的输入或提示生成各种风格的图像,这为艺术家、设计师和创作者提供...
-
别说不会微服务了,五分钟教你巧妙玩转分布式下链路追踪!
本篇文章我将给大家介绍“分布式链路追踪”的内容,对于目前大部分采用微服务架构的公司来说,分布式链路追踪都是必备的,无论它是传统微服务体系亦或是新一代Service Mesh的微服务架构!而具体介绍的内容,本文不是完全讲理论,而是希望从理论到实践,引导大家去...
-
大数据导论(三:大数据的采集及预处理)
1、大数据采集 1.1 大数据采集概念 数据采集(DAQ)又称数据获取,通过RFID射频数据、传感器数据、社交网络数据、移动互联网数据等方式获得各种类型的结构化、半结构化及非结构化的海量数据。 1.2 常用的数据采集方式 大数据的采集通常采用...
-
Koordinator v1.1发布:负载感知与干扰检测采集
作者:Koordinator 社区 背景 Koordinator 旨在为用户提供完整的混部工作负载编排、混部资源调度、混部资源隔离及性能调优解决方案,帮助用户提高延迟敏感服务的运行性能,挖掘空闲节点资源并分配给真正有需要的计算任务,从而提高全局的资源利...
-
Devops下的分布式监控方案
1基础监控的设计需求 现在devops,云计算,微服务,容器,大数据等理念正在逐步落地和大力发展,企业的服务器越来越多,架构越来越复杂,相应的应用运行基础环境越来越多样化,服务越来越微化,带来的监控压力也越来越大; 如何在错综复杂的监控源里面...
-
Flink CDC + Hudi 海量数据入湖在顺丰的实践
本文整理自顺丰大数据研发工程师覃立辉在 5月 21 日 Flink CDC Meetup 的演讲。主要内容包括: 顺丰数据集成背景 Flink CDC 实践问题与优化 未来规划 点击查看直播回放 & 演讲PDF...
-
20.网络爬虫—Scrapy-Redis分布式爬虫
网络爬虫—Scrapy-redis详讲 Redis的安装与使用 分布式概念和作用 分布式爬虫 分布式爬虫特点 redis的使用 Redis 操作/启动 Redis Desktop Manager下载 特点和架构 安装和使用 Scrapy-re...
-
为何 Filebeat 采集日志不是实时的?(采集时间与log本身时间有差异)
注:本文中 filebeat 的版本为 7.5,不同版本的 filebeat 的行为可能有所差异。 一、前言 filebeat 采集的日志的时间戳,和日志管理平台实际收到的日志时的时间戳,通常都会有几秒的延迟,有些情况下甚至能达到十几秒。其中固然...