-
AIGC:使用生成对抗网络GAN实现MINST手写数字图像生成
1 生成对抗网络 生成对抗网络(Generative Adversarial Networks, GAN)是一种非常经典的生成式模型,它受到双人零和博弈的启发,让两个神经网络在相互博弈中进行学习,开创了生成式模型的新范式。从 2017 年以后,GAN相...
-
几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。 传统的方法创建这些模型不仅需要大量时间,还需要能够捕捉多视角照片的专业设备,此外还依赖于技术熟练的专业人员。 与此相反,在日常生活中,我们最常见...
-
CNET的发行商因AI丑闻而难以出售
根据Axios的一份新报告,CNET母公司Red Ventures一直在寻求出售这家坚定的技术网站。但不幸的是,对于Red Ventures来说,它很难找到买家——CNET的人工智能丑闻至少要承担部分责任。 图源备注:图片由AI生成,图片授权服务商Mid...
-
[算法前沿]--005-和chatgpt一样的大模型LLaMA可以运行在pc上?
未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行. LLaMA Facebook的LLaMA 模型和Georgi Gerganov 的llama.cpp的结合。 LLaMA,这是一组包含 7B 到 65B 参数的基础语言模型。我们在数万亿个令...
-
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
如何根据特定需求选择视觉模型? ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较? 来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。 论文地址:ht...
-
腾讯AI图像生成工具软件免费使用地址 PhotoMaker体验入口
PhotoMaker是一种高效的个性化文本到图像生成方法。它能将任意数量的输入ID图像编码成堆叠ID嵌入,以保留身份信息。这种嵌入方式不仅可以全面地封装相同输入ID的特征,还能容纳不同ID的特征以供后续整合。PhotoMaker通过提出的面向ID的数据构建...
-
Stable-diffusion-webui 本地部署及使用
Stable-diffusion-webui 本地部署及使用 本地部署stable-diffusion-webui(windows 1.安装conda; 2.创建conda env 和python 3.10.6; 3.更新pip; 4.安装...
-
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...
-
AI无代码网页组件开发工具免费下载地址 Compo官网体验入口
Compo Chrome Extension是一个基于AI组件驱动技术的开源工具,旨在通过简单的文本输入帮助用户快速创建、设计和开发网页组件。它通过集成到应用程序中或使用Vallmore的企业AI集成到应用、工具或平台中,提供了多样化的使用场景。Compo...
-
三个臭皮匠顶个诸葛亮?可能是真的,已证实混合多个小模型性能比肩GPT3.5
在对话型人工智能(AI)研究中,存在趋势即朝着开发参数更多的模型方向发展,如 ChatGPT 等为代表的模型。尽管这些庞大的模型能够生成越来越好的对话响应,但它们同时也需要大量的计算资源和内存。本文研究探讨的问题是:一组小模型是否能够协同达到与单一大模型...
-
谷歌推几何AI系统AlphaGeometry,实力达奥林匹克金牌得主
Google DeepMind 发布了一个名为AlphaGeometry 的人工智能系统,它可以解决复杂的几何问题,其水平接近人类奥林匹克金牌得主——这是人工智能性能的突破。在对30道奥数几何题的基准测试中,AlphaGeometry 在标准奥数时限内解决...
-
AIGC实战——像素卷积神经网络(PixelCNN)
AIGC实战——像素卷积神经网络 0. 前言 1. PixelCNN 工作原理 1.1 掩码卷积层 1.2 残差块 2. 训练 PixelCNN 3. PixelCNN 分析 4. 使用混合分布改进 PixelCNN 小结 系列链接...
-
GLM-4体验入口 智谱AI多模态大模型在线使用地址
GLM-4是由智谱AI在首届技术开放日上发布的一款新型大模型。GLM- 4 在性能上全面提升近60%,支持更长的上下文、更强的多模态支持和更快速的推理。产品定位为下一代基座大模型,旨在为文本处理、数据分析、图像生成等领域提供高效的AI解决方案。 点击前往...
-
Android Studio安装AI编程助手Github Copilot
csdn原创谢绝转载 简介 文档链接 https://docs.github.com/en/copilot/getting-started-with-github-copilot 它是个很牛B的编程辅助工具,装它,快装它. 支持以下IDE: In...
-
2024年IT趋势、预测和建议
2024年将是创新技术激动人心的一年,其中人工智能(AI 处于最前沿。那些在技术领域工作了一段时间的人,早就意识到人工智能的潜力。随着人工智能越来越多地进入公众视野,企业必须快速确定利用这些技术的最佳方法,同时密切关注网络安全。随着我们进入快速发展的数...
-
AI+医疗新势力:Shimmer在线平台为ADHD患者提供专业辅导 吸引220万美元投资
近日,由YC孵化的小众领域公司 Shimmer 宣布成功完成220万美元的种子轮融资,由 Worklife Ventures 和 SeedtoB Capital 共同领投。Shimmer 是一家致力于为成年多动症(ADHD)患者提供实时专业辅导的在线平台,...
-
数据中心无法实现自动化的五件事
人们很容易认为,在数据中心及其他领域,自动化没有界限。在这个世界上,人工智能似乎为改善数据中心运营和网络提供了无限的机会,整个IT行业都接受了工作流可以完全自动化以至于我们达到NoOps状态的概念,在数据中心内部似乎没有什么是我们不能自动化的。 然而,...
-
AI实时语音字幕翻译工具免费使用地址 Byrdhouse官网体验入口
Byrdhouse提供了基于AI的实时语音翻译和字幕翻译服务,支持超过 100 种语言,极大地便利了国际会议、多语种团队沟通和跨国公司内部交流等场景。Byrdhouse的目标是解决实时翻译中的难题,让用户可以专注于与全球团队和国际合作伙伴的沟通协作。使用B...
-
自动泊车全面调研!汇集行业标准趋势、评测指标、系统介绍各个方面!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 自动泊车系统是指在没有人工干预的情况下,车辆本身可以自主的实现停车位的寻找并完成准确的泊车,同时该系统也可以根据用户的需求准确移动到用户指定的位置上。如果自动泊车技术成熟后,可以极大缓解人们...
-
GPT-SoVITS体验入口地址 AI语音克隆软件分享
GPT-SoVITS是一个强大的语音转换软件。该产品具有零样本TTS、少样本TTS、跨语言支持和WebUI工具等功能,可用于语音转换、语音合成、语音处理等场景。GPT-SoVITS的体验下载入口在哪呢,这里我们来看GPT-SoVITS的官方体验入口。 &...
-
AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)
一些结论 本次为第二部分的测评,第一部分的测评请点击这里。综合结论::通义千问 > 讯飞星火 > 文心一言。 逻辑推理能力:讯飞星火 = 通义千问 > 文心一言。对于基本的逻辑推理问题,三个AI聊天机器人都能通过测试。但对...
-
基于大语言模型赋能智体的建模和仿真:综述和展望
本文经自动驾驶之心公众号授权转载,转载请联系出处。 23年12月论文“Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspecti...
-
Stability AI发布全新代码模型Stable Code 3B,媲美70亿Code Llama,没GPU也能跑
今天,Stability AI发布了自家在2024年的第一个模型——Stable Code3B。 顾名思义,Stable Code3B专注于代码能力,实际的表现也是非常亮眼。 在仅仅3B参数的规模之下,达到了比肩Code Llama7B的效果。 相...
-
2023年的深度学习入门指南(24) - 处理音频的大模型 OpenAI Whisper
2023年的深度学习入门指南(24 - 处理音频的大模型 OpenAI Whisper 在这一讲之前,我们所用的大模型都是针对文本的。这一讲我们增加一个新的领域,即音频。我们将介绍OpenAI的Whisper模型,它是一个处理音频的大模型。 Wh...
-
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生...
-
GPT-SoVITS体验入口 AI声音克隆工具软件免费下载地址
GPT-SoVITS-WebUI是一个强大的零样本语音转换和文本到语音WebUI工具。它提供了零样本TTS、少样本TTS、跨语言支持等功能,并且支持英语、日语和中文。GPT-SoVITS-WebUI提供了一系列集成工具,包括语音伴奏分离、自动训练集分割、中...
-
Stable Diffusion with Diffusers 学习笔记: 原理+完整pipeline代码
文章目录 01 使用 02 Stable Diffusion 的工作原理 The autoencoder (VAE The U-Net The Text-encoder Latent Diffusion 又快又高效的原因 Stable Di...
-
能做鬼脸、摇滚、自拍,听懂你说的话!GPT-4驱动的实体机器人
东京大学的研究人员将GPT-4模型,集成在实体机器人Alter3中,可将文本、语言直接转化成机器人动作,例如,做一个自拍动作;装一个“鬼样”;做一个摇滚音乐动作等,就连微笑、眨眼这样的面部表情动作也没问题。 在GPT-4的帮助下,Alter3建立了语言反馈...
-
如何将知识图谱与AIGC结合?京东是这么做的
一、导言 首先介绍一下京东在电商场景下 AIGC 方面的探索。 这是一个商品营销文案自动生成的全景图,自下而上首先是商品的输入信息。输入信息是异构多源的,包括商品的商详页里的图片、文本、商品的标题以及商品的知识图谱。通用的知识图谱是三元组的形式,...
-
DiffIR: Efficient Diffusion Model for Image Restoration 利用扩散模型进行图像重建
一、主要贡献 •我们提出了DiffIR,一种强大、简单、高效的基于扩散模型的的图像修复方法。与图像生成不同的是,输入图像的大部分像素都是给定的。因此,我们利用DM强大的映射能力来估计一个紧凑的IPR(IR Prior Representation,图像修...
-
文心一言答案会重复吗 神码ai
大家好,今天来聊聊文心一言答案会重复吗,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 文心一言答案会重复吗 一、引言 随着人工智能技术的不断发展,百度推出的文心一言作为...
-
一文读懂大型语言模型参数高效微调:Prefix Tuning与LLaMA-Adapter
芝士AI吃鱼 在快速发展的人工智能领域中,高效、有效地使用大型语言模型变得日益重要,参数高效微调是这一追求的前沿技术,它允许研究人员和实践者在最小化计算和资源占用的同时,重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...
-
ChatGPT+Midjourney,带你领略古诗词的魅力
说起 Midjourney,AI 绘画界的出图质量无人怀疑,特别是 V5 版本的上线,解决了人体的手画不好的瑕疵之后,更是迎来一波好评。国外版本的话,需要用 Discord 软件与之交互,对普通用户而言还是有使用门槛的,幸运的是 MJ 尝试在国内落地...
-
Midjourney的一些“咒语”【自用-1】
学习思路:翻译成英文就可以 公式是:主体描绘 + 核心主体 + 主体动作 + 风格 + 光效 + 色彩 + 视角 + 质量 + 命令 描写人物可添加的修饰词:服装细节精致, 咒语001:中国风 一位穿着红色汉服、中式风格的女孩,原始照片,长发,...
-
如何优雅的使用ChatGPT指令,指令大全
充当 Linux 终端 我希望你充当Linux终端。我将键入命令,您将回复终端应显示的内容。我希望你只回复一个唯一代码块中的终端输出,没有别的。不要写解释。除非我指示你这样做,否则不要键入命令。当我需要用英语告诉你一些事情时,我会把文本放在大括...
-
Audacity如何将音频等长分割
一、首先打开Audacity,导入音频 二、点击工具》常规间隔标签 三、在“常规间隔标签”中,标签数量就是你要导出多少个视频,标签间隔就是你想分割的每个视频要多长(点击“常规间隔标签”之前,先Ctrl+A选择整个视频,然后再点击“常规间隔标签”)。...
-
使用chargpt加 midjourney 生成高质量的图片
如果你还不知道如何使用chargpt(网站不对国内开放 ,请看我的另一篇文章 首先介绍一下 chargpt 是一个最近火到爆炸的人工智能聊天工具,可以用它来生成图片,因为默认chargpt是不能直接输出图片的,需要给它指令已markdown...
-
【AI绘画】Stablediffusion必不可少的使用方法之Lora(2)
各位小伙伴们大家好,在上期我们讲过了Lora的原理和使用前景,那么这期主要要说的就是Lora应该如何使用! 前提是各位小伙伴们已经下载好了Lora,Lora文件需要放在Webui文件夹内的models中的Lora目录内。 Lora的使用方法有三个:...
-
任务15、MidJourney视频(Video)参数动态上线,制作惊艳动画短片
15.1 任务概述 本次任务将帮助你掌握Midjourney中的Video参数,并利用这些参数创作出令人惊艳的绘画作品。通过学习Video参数的基本概念和功能,以及案例的实际应用,你将学会如何正确设置和调整这些参数,从而达到你所期望的绘画效果。最终,你将...
-
【Stable diffusion inpaiting】训练自己数据集
https://github.com/advimman/lama/tree/7dee0e4a3cf5f73f86a820674bf471454f52b74f prepare your data: 1 Create masks named as `[...
-
得帆信息创始人-张桐,受邀出席 BV百度风投AIGC主题论坛
近日,得帆信息创始人兼CEO张桐,作为百度风投被投代表企业创始人受邀出席“向未来,共成长” BV百度风投AIGC主题论坛。 与包括上海市徐汇区相关部门领导、百度集团相关事业部负责人及代表,以及来自国寿资本、中网投、麦顿投资的投资人、BV百度风投其...
-
图灵日记之java奇妙历险记--抽象类和接口
目录 抽象类 概念 抽象类语法 接口 概念 规则 使用 特性 实现多个接口 接口的继承 接口使用实例 Clonable接口和深拷贝 抽象类和接口的区别 Object类 抽象类 概念 在面向对象的概念中,所有对象都是通过...
-
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!
目录 一.前言 二.本机环境 三.安装步骤: 步骤1:下载Git并添加环境变量 步骤2:下载ffmpeg并添加环境变量 步骤3:安装pytorch 步骤4:安装whisper 四.whisper的应用 应用1:识别mp3歌曲中的歌词 应用...
-
基于 PAI-EAS 一键部署 Stable Diffusion AIGC 绘画
人工智能平台PAI完成云上Stable Diffusion以文生图应用搭建,支持两种方式: 使用交互式建模 PAI-DSW 使用模型在线服务 PAI-EAS 两种部署适用人群: 1.使用交互式建模 PAI-DSW 部署Stable Diffus...
-
深入探索AIGC技术:原理、应用与未来发展
深入探索AIGC技术:原理、应用与未来发展 摘要:随着人工智能技术的飞速发展,AIGC(人工智能生成内容)已成为当今科技领域的前沿话题。本文将深入探讨AIGC的原理、技术应用以及未来发展趋势,并分析其对计算机科学和整个社会的影响。 一、AIGC的基本原...
-
论文阅读_善用Midjourney
论文信息 name_en: Grimm in Wonderland: Prompt Engineering with Midjourney to Illustrate Fairytales name_ch: 用Midjourney生成格林童话插图 pa...
-
AI绘图:chatGpt,midjourney, discord
一、关键词模板: image prompts: text prompts: 内容特征、画风、艺术效果、视角、背景、灯光 等等 parameters: 参数、模型 二、midjourney指令: 三、chatgpt 数据训练 输入模型信...
-
【Stable Diffusion XL】huggingface diffusers 官方教程解读
文章目录 01 Tutorial Deconstruct a basic pipeline Deconstruct the Stable Diffusion pipeline Autopipeline Train a diffusion mo...
-
【慕伏白】stable diffusion webui 使用手册
文章目录 Global Parameters 1. Stable Diffusion checkpoint 2. Functions text2img 1. Prompt Prompt Editing 2. Negative prompt...
-
小米申请注册ChatMI、大模型商标
天眼查App显示,近日,小米科技有限责任公司申请注册科学仪器类“ChatMI”商标、运输工具类“小米大模型”商标,当前商标状态均为等待实质审查。 此外,小米科技有限责任公司还申请注册多枚“CARIOT”“小米 CARIOT”“XIAOMI CARIOT”...