-
表格数学推理准确率达98.78%!UCLA推出全新「变色龙推理框架」
在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽管表现出色,但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。 为了应对这些挑战,来自UCLA等机构的研究人员打造了全新的Chameleon框架,其独特的即插即用模型融合了多种工具,包括...
-
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了—— 这一次,只需一张脸部照片、一句话描述,就能让你在任何地方跳舞! 例如下面这段《擦玻璃》的舞蹈视频: 图片 你所需要做的就是“投喂”一张人像,以及一段prompt: 一个女孩,微笑着,...
-
当GPT-4V充当机器人大脑,可能你都没AI会规划
GPT-4V 已经能帮我们设计网站代码,控制浏览器,这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 最近,来自清华大学交叉信息研究院的研究者提出「ViLa」算法,实现了让 GPT-4...
-
胜率达94.08%!李开复Yi-34B最新成绩超过LLaMA2等主流大模型
近期,李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大学伯克利分校主导的LMSYS ORG排行榜中,以1102的Elo评分追平了GPT-3.5。此外,在中文SuperC...
-
直追GPT-4!李开复Yi-34B新成绩公布:94.08%的胜率超越LLaMA2等主流大模型
仅次于GPT-4,李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中,以94.08%的胜率,超越LLaMA2 Chat 70B、Claude 2、ChatGPT! 图片 不仅如此,在加州大学伯克利分校主导的LMSYS...
-
你真的看懂扩散模型(diffusion model)了吗?(从DALL·E 2讲起,GAN、VAE、MAE都有)
本文全网原创于CSDN:落难Coder ,未经允许,不得转载! 扩散模型简单介绍 我们来讲一下什么是扩散模型,如果你不了解一些工作,你可能不清楚它究竟是什么。那么我举两个例子说一下:AI作画(输入一些文字就可以得到与你描述相符的图像)和抖音大火的...
-
Learn Prompt-Midjourney 图片生成
简介 随着 ChatGPT 的爆火,越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。目前已经有许多图像生成工具,如 Midjourney,Stable Diffusion,DALL-E,Firefly等。本课程主要是以...
-
【多模态】5、BLIP | 统一理解与生成任务 为图像生成更高质量的文本描述
文章目录 一、背景 二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...
-
更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了
已上微软 Azure,即将要上 AWS、Hugging Face。 一夜之间,大模型格局再次发生巨变。 一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题,一直不可免费商用。 今日,Meta 终于发布了大家期待...
-
【AI绘画】Stable Diffusion的介绍及程序示例
Stable Diffusion 1.背景 2.StableD 的原理 3.StableD 的应用 3.1.如何使用 StableD 进行图像生成 3.2 图像生成与编辑 3.2.1 生成新图像 3.2.2 图像编辑 1.背...
-
视觉CV-AIGC一周最新技术精选(2023-11)
PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型(LMM)扩...
-
Imagine with Meta AI官网体验入口 AI文生图工具软件app免费下载地址
《Imagine with Meta AI》是一款利用AI技术的图片生成工具。用户只需通过语音描述所想要的画面,该工具就能自动生成相应的图片。这一创新功能为用户提供了丰富多样的创作可能性。目前,该产品仍处于内测阶段,用户需要登录后才能使用生成功能。那么,想...
-
2023年度AI领域的六大顶级投资者
在当前的创业环境中,利用人工智能 (AI) 的公司数量显着增加。在今年出现的十家独角兽公司中,有六家是基于人工智能的初创公司。这一趋势在业界引起了巨大的轰动,现有的人工智能初创公司的估值也出现了显着的飙升。 这些发展凸显了人工智能在当前商业环境中的重要性...
-
谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将到来的人工智能时代
12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。 此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2...
-
Stable Diffusion:开启AI魔法绘画的无限可能
? 个人网站:【 海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的:?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴,请点击【全栈技术交流群】 随着人工智能技术的蓬勃发展,图像生成和艺术创作领域掀起了一股新的浪潮。在这股浪潮中,St...
-
Meta语音达LLaMA级里程碑!开源MMS模型可识别1100+语言
【新智元导读】Meta的大规模多语言语音 (MMS) 项目将彻底改变语音技术,使用wav2vec 2.0的自监督学习,MMS将语音技术扩展到1100到4000种语言。 在语音方面,Meta又达到了另一个LLaMA级的里程碑。 今天,Me...
-
AIGC产业研究报告 2023——图像生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
AI文生视频,会在明年迎来“GPT时刻”
在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。 而与之相比,AI文生视频,却是一个迟迟未被“攻下”的阵地。 抖动、闪现、时长太短,这一系列缺陷,让AI生成的视频只能停留在“图一乐”的层面,很难拿来使用,更不要说提供商...
-
【stable diffusion 小白最全详细使用教程+大模型资源】
文章目录 一、前言 二、安装 1.解压后点击启动器运行依赖,然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中 三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...
-
Meta 、IBM等联合50多家公司结构成立 AI 联盟
标题:Meta 和 IBM 推出 AI 联盟 Meta Platforms 和 IBM 最近联合推出了一个名为 AI 联盟的合作项目,该联盟由50多家人工智能公司和研究机构组成。这个联盟旨在推动一种被称为 “开放模型” 的人工智能发展方式,并希望在快速增...
-
大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种
大模型的“5年高考3年模拟”数学题来了,还是加强强强版! 微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新多模态数学推理基准数据集。 名为“MathVista”。 涵盖各种题型共6141个问题,来源于28个现有的多模态数据集和3个新标...
-
如何在企业中采用生成式人工智能
在企业中嵌入生成式人工智能的用例是什么?它如何帮助减轻重复性管理的负担?它的局限性是什么? 研究机构Gartner公司报告称,在过去三年,全球的风险投资公司在生成人工智能解决方案上投资了逾17亿美元。随着人工智能增强的聊天机器人风靡全球,这种情况只会急...
-
成功实施人工智能的八个步骤
实施人工智能从来不是一件一劳永逸的事情,它需要广泛的战略,以及不断调整的过程。 以下了解企业成功实施人工智能的一些关键的实施步骤,以帮助人工智能和机器学习充分发挥其潜力。 人工智能和机器学习正从商业流行术语转向更广泛的企业应用。围绕战略和采用的努力让...
-
开源语言大模型演进史:向LLaMA 2看齐
本文是开源 LLM 发展史系列文章的第三部分。此前,第一部分《开源语言大模型演进史:早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史:高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型(即已进行预训练但尚未微...
-
LLaMA模型微调版本:斯坦福 Alpaca 详解
项目代码:https://github.com/tatsu-lab/stanford_alpaca 博客介绍:https://crfm.stanford.edu/2023/03/13/alpaca.html Alpaca 总览 Alpaca 是 L...
-
Pika1.0内测官网体验入口 AI视频制作软件app免费下载地址
《Pika》是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。这个平台主要功能包括支持多种创意想法转视频、提供专业视频效果,同时操作简单易用。《Pika》在哪里可以体验呢?下面就给大家带来《Pika》官网体验入口和免费app下载...
-
专注图表理解,腾讯、南洋理工等开源图表羊驼大模型ChartLlama
在图像理解领域,多模态大模型已经充分展示了其卓越的性能。然而,对于工作中经常需要处理的图表理解与生成任务,现有的多模态模型仍有进步的空间。 尽管当前图表理解领域中的最先进模型在简单测试集上表现出色,但由于缺乏语言理解和输出能力,它们无法胜任更为复杂的问答...
-
SAM&Stable-Diffusion集成进化!分割、生成一切!AI绘画新玩法
自SAM「分割一切」模型推出之后,二创潮就开始了,有想法有行动!飞桨AI Studio开发者会唱歌的炼丹师就创作出SAM进化版,将SAM、Stable Diffusion集成,实现「分割」、「生成」能力二合一,并部署为应用,支持在线使用! 在线免费...
-
Pika1.0官网体验入口 视频制作AI软件免费app下载地址
《Pika》是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。它支持多种创意想法转化为视频,提供专业的视频效果,同时操作简单易用。该平台采用免费试用模式,主要面向创意者和视频爱好者。《Pika》在哪里可以体验呢?下面就给大家带来...
-
文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研
基于近年来图像处理和语言理解方面的技术突破,融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。 文本生成图像(text-to-image)是图像和文本处理的多模态任务的一项子任务,其根据给定文本生成符合描述的真实图像,具有巨大的应用潜力,如...
-
解锁机器学习-梯度下降:从技术到实战的全面指南
本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例,本文旨在为读者提供一种直观且实用的视角,以理解这些优化算法的工作原理和应用场景。 关注TechLead...
-
美国作家协会发起生成式AI调查:保护作家权益与文学多样性
近日,为了解决人工智能生成图书和使用作家素材培训AI的日益关切,作家协会启动了一项公共调查。调查中提出的8个问题,涉及到是否需要作家同意将其作品用于构建和发展AI系统,以及是否应该给予相应的经济补偿。 在一份声明中,作家协会指出:“一些公司擅自抓取数百万本...
-
Smart Copilot:大模型在技术服务和智能客服领域提效的最佳实践
欢迎来到魔法宝库,传递AIGC的前沿知识,做有格调的分享❗ 喜欢的话记得点个关注吧! 随着云计算技术的快速发展,越来越多的企业和个人选择将业务迁移到云端。有很多云厂商为客户提供了灵活、可扩展的计算资源和服务,使得客户能够更加专注于核心业务。 然而,...
-
AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年
陶哲轩一直看好,ChatGPT将颠覆数学证明,而如今,AI在化学领域的潜力同样深不可测。 今天,220万种晶体结构完全被AI预测出来了。 这是什么概念?相当于近800年的知识价值。 谷歌DeepMind开发全新AI工具GNoME,能够预测新材料的稳定性,...
-
百度视频推荐跨域多目标预估与融合的实践和思考
一、百度视频背景介绍 1、统一产品形态 一方面,百度 APP 的所有视频场景已经升级成统一的沉浸式(上下滑)交互形态;另一方面,基于百度统一的大模型,我们打通了所有场景的数据和推荐体验。交互和数据的统一可以更好地实现生态共赢,促进百度视频的长远发展。...
-
AI制作视频——mov2mov以及inpaint
背景 AI制作视频的几种思路 1.从零开始生成:清华的cogview,runway gen-1、gen-2,微软的女娲 这个思路,就是认为可以通过文字描述的方式把视频画面描述出来,通过对文本-视频帧内容-视频内容的数据对的平行语料的学习。学习到文本故...
-
生成式AI游戏开发平台Bitmagic公测,通过文本提示创建游戏
Bitmagic宣布其基于生成式AI的游戏开发平台已进入公测阶段,通过文本提示让玩家轻松创作3D游戏。这一平台是全球首个允许用户通过单一提示创建完全可玩游戏的系统。通过在文本提示中输入描述,玩家可以将创意交给Bitmagic,后者将根据文字内容生成完整可玩...
-
人人都能用好大模型-结构化的Prompt让你轻松上手
Prompt,中文可以翻译为提示词,是一种用于引导大模型生成特定内容的文本输入。Prompt的作用是告诉大模型你想要它做什么,以及给它一些必要的信息和约束条件。Prompt的好坏直接影响了大模型的输出质量和效率。 Prompt的写作是一门艺术,也是一门科...
-
Midjourney 参数合集
探索Midjourney之旅,学习绘画与AI,一同成长。加入「阿杰与AI」公众号,参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...
-
AI测试|史上最全,细数AIGC在测试领域落地的困难点
一、引言&背景 自2022年由横空出世的ChatGPT引发的各类AIGC(Generative AI)爆发以来,人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域,各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...
-
【解锁未来】让微软Copilot介绍自己,再由ChatGPT润色文章,到底能成什么样?
文章目录 前言 Copilot的介绍 ChatGPT 4.0 的润色 总结 前言 今天突发奇想,如果让微软Copilot介绍自己,再由ChatGPT润色文章,到底能成什么样? Copilot的介绍 问:撰写关...
-
调教 文心一言 生成 AI绘画 提示词(Midjourney)
文章目录 第一步 第二步 第三步 第四步 第五步 第六步 第七步 第八步 文心一言支持连续对话 我瞎玩的非专业哈哈 第一步 你好,今天我们要用扩散模型创建图像。我会给你提供一些信息。行吗? 第二步...
-
中国团队开源大规模高质量图文数据集ShareGPT4V
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。 该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、...
-
【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍!
Llama 2 发布! Meta 刚刚发布了 LLaMa 2,它是 LLaMA 的下一代版本,具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸:7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构,并且是...
-
ChatGPT锐评“一生不结婚,会面临什么” 抖音获赞25.5万
ChatGPT3.5版本如今在手机端也能免费使用语音对话,激起了网友们的创意潮流。抖音博主“AI领航者·奕霆”挑战ChatGPT,提出了一个备受关注的问题:“一生不结婚,会面临什么?” ChatGPT的回答却出人意料: "如果你选择了终身不婚,你记住啊,当...
-
AIGC之GPT-4:GPT-4的简介与详细攻略
AIGC之GPT-4:GPT-4的简介与详细攻略 简介 欢迎来到人工智能生成内容(AIGC)时代的新篇章!本篇博客将介绍GPT-4(Generative Pre-trained Transformer 4)的核心原理、意义、亮点、技术点、缺点以及使...
-
讯飞智文官网体验入口 AI办公软件哪个好用
讯飞智文是一款人工智能文档创作平台,它由科大讯飞股份有限公司开发和推出。它可以根据用户的输入内容,自动生成高质量的文档,包括文章、PPT、视频等多种格式。它基于讯飞星火认知大模型,支持处理各种内容格式,包括一句话主题、长文本、音视频等多种形式。它不仅可以提...
-
OpenAI董事会变动只剩男性 福布斯提议十位女性候选人
在OpenAI近期的变动中,董事会经历了巨大的变革,由此形成了一个全白人、全男性的董事会。在这一连串的变动中,原本拥有两名女性董事的OpenAI董事会在不到一个月的时间内变成了全男性成员。 原董事会成员Helen Tomer因与CEO Sam Altman...
-
维基百科创始人评价 ChatGPT:当前阶段「糟糕」,但 50 年后可能超越人类
在最近接受 Euronews Next 采访时,维基百科创始人吉米·威尔士(Jimmy Wales 对当前 ChatGPT 的性能表达了严厉的批评。他指出,该 OpenAI 开发的流行人工智能(AI)工具在撰写维基百科文章时效果「糟糕」,因为它经常「错漏百...
-
Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记
文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...