-
一张照片、一段声音秒生超逼真视频!南大等提出全新框架,口型动作精准还原
一段音频+一张照片,瞬间照片里的人就能开始讲话了。 生成的讲话动画不但口型和音频能够无缝对齐,面部表情和头部姿势都非常自然而且有表现力。 而且支持的图像风格也非常的多样,除了一般的照片,卡通图片,证件照等生成的效果都非常自然。 再加上多语言的支持,瞬间照...
-
顶尖AI公司薪酬榜曝光:600万天价年薪震惊网友
最近有一张薪酬表格流出,引发了很多人的热议。这张薪酬表格显示,OpenAI的年薪高达600万美元,超过了所有大型科技公司,而初级码农的时薪却低至85美元。因此,这一消息引发了广泛的讨论,很多人开始关注顶尖AI公司的薪资情况。 薪酬表格的数据引发了网友们的质...
-
Stable Diffusion绘画系列【5】:粉色机甲少女
《博主简介》 小伙伴们好,我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~ ?感谢小伙伴们点赞、关注! 《------往期经典推荐----...
-
微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%
教大模型调用工具,已经是AI圈关注度最高的话题之一了。 这不,又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。 相比其它...
-
美国联邦机构提出1200个AI用例,但只有少数得以实施
美国联邦机构看到在其日常工作中使用人工智能工具的许多可能性,但实际上只有其中一小部分被付诸实践。周二发布的一份报告显示,审计署发现20个非国防机构在政府中鉴定了超过1,200种用例,但它们只实施了其中约16%的人工智能用例。 例如,人事管理局正在利用人工智...
-
前端食堂技术周刊第 89 期:ES 2023、MDN Playground、TS 5.2 Beta、逆向分析 GitHub Copilot
美味值:????? 口味:糯米糍荔枝 食堂技术周刊仓库地址:https://github.com/Geekhyt/weekly 大家好,我是童欧巴。欢迎来到前端食堂技术周刊,我们先来看下上周的技术资讯。 技术资讯 Ecma Internati...
-
全方位、无死角的开源,邢波团队LLM360让大模型实现真正的透明
开源模型正展现着它们蓬勃的生命力,不仅数量激增,性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹:「开源人工智能模型正走在超越专有模型的路上。」 专有模型在技术性能和创新能力上展现了非凡的力量,但是它们不开源的性质成为 LLM 发...
-
字节跳动豆包官方体验入口 AI智能助手软件推荐
豆包是字节跳动开发的一款AI工具,可以进行智能问答、文本创作、图片生成等功能。根据网上的一些评价,豆包的语义理解和数理逻辑能力不错,生成的内容也比较准确和有趣。但是,豆包还处于早期开发阶段,可能存在一些局限和不足,还需要持续改进。那么豆包在哪里可以体验呢?...
-
ChatGPT、文心一言、New Bing到底哪个更AI?
目录 ChatGPT 和 GPT4 什么关系? 1. 写作 题目 ChatGPT ChatGPT 国外镜像网站 文心一言 New Bing 总结 2. 数学题目 题目 ChatGPT ChatGPT 国外镜像网站 文心一言 Ne...
-
用RLHF 2%的算力让LLM停止有害输出,字节提出LLM遗忘学习
随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hallucinations,即错误事实)? 如何在数据政策更改后快速迭代 LLM?这些问题在人工智能法律...
-
对话中国AI绘画著作权第一案当事人:AI生成内容如何维权?
AI绘画无疑是今年AI行业最受关注的领域之一,光是文本生成图像就已经进化到实时响应了,各大社媒平台也流行着用AI生成的图文、视频内容。 截至发稿前,#Ai绘画#话题在小红书的浏览量达28.2亿次,在抖音则超过295亿次。 与此同时,市场火热的另一面是持续不...
-
ChatGPT与文心一言:人工智能技术在商业领域的应用探究
人工智能技术的发展为商业领域的创新和应用带来了重大的机遇和挑战。本文将围绕聊天生成语言模型ChatGPT和短文本生成AI模型文心一言,分析其在商业领域中的应用场景和商业价值,并讨论中国版ChatGPT在未来的发展前景。 关键词:人工智能技术、商业领域、C...
-
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
大模型现在真的是越来越卷了! 11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的流量。 谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「视频造假」。 就在今天,微软正式发布了曾在11...
-
奥特曼回归OpenAI后首次公开露面 称AI进步“有点吓人”
据外媒报道,山姆·奥特曼(Sam Altman)周一在一场公开论坛上首次露面,这是他在“OpenAI政变风波”后重新出任该公司 CEO 后首次公开露面。 奥特曼在论坛上接受了采访,他再度谈到了人工智能,将由AI引发的技术革命描述为“与此前不同、有点吓人”。...
-
高效微调技术QLoRA实战,基于LLaMA-65B微调仅需48G显存,真香
目录 环境搭建 数据集准备 模型权重格式转换 模型微调 模型权重合并...
-
Snapchat推出AI生成照片功能,Plus会员可定制分享
Snapchat近日宣布为其Plus会员推出了一系列新的人工智能功能,其中包括一种通过AI生成并发送图像的方法。 订阅Snapchat的$3.99计划的用户可以通过在相机界面右侧的工具栏上点击“AI”按钮来使用此功能。这将打开一个窗口,用户可以在其中输入文...
-
重磅!基于GPT-4的全新智能编程助手 GitHub Copilot X 来了!
GitHub Copilot相信大家一定不陌生了,强大的智能代码补全功能一度让媒体直呼程序员要被替代。 随着OpenAI推出全新的GPT-4,GitHub Copilot也在3月22日,推出了全新一代产品:GitHub Copilot X 。...
-
Meta 推出雷朋智能眼镜的多模态 AI 功能测试:可识别物体并翻译语言
Meta 宣布将开始推出其多模态 AI 功能的早期访问测试,这些功能将应用于 Meta Ray-Ban (雷朋)智能眼镜,能够通过眼镜的摄像头和麦克风告知用户所看和所听的内容。 马克·扎克伯格在 Instagram 的一个视频中展示了这次更新,他询问眼...
-
Midjourney生成LOGO指南
目录 常见的Logo 宠物店Logo Graphic Logo Lettermark Logo Geometric Logo Mascot Logo 增加风格——艺术运动 每个产品都有自己的专属名称,也有自己专属的Logo,...
-
微软首次推出27亿参数的Phi-2模型,性能超过许多大型语言模型
微软发布了一款名为Phi-2的人工智能模型,该模型表现出了不凡的能力,其性能可媲美甚至超越规模是其25倍的、更大、更成熟的模型。 微软在近日的一篇博文中宣布,Phi-2是一个拥有27亿参数的语言模型,与其他基础模型相比,它在复杂的基准测试中表现出了 "先...
-
OpenAI非营利部门去年净收入不足4.5万美元
近日,OpenAI的非营利部门在其最新的美国税务文件中披露,去年仅获得了44,485美元的净收入,引起了外界的关注。尽管其盈利业务,特别是ChatGPT,可能为公司创造了数百万美元的收入,这一差距令人瞩目。 成立于2015年的OpenAI最初是一个致力于为...
-
InsCode Stable Diffusion使用教程【InsCode Stable Diffusion美图活动一期】
记录一下如何使用 InsCode Stable Diffusion 进行 AI 绘图以及使用感受。 一、背景介绍 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一个叫 Stable Di...
-
如何采用智能机器人技术增强业务运营
智能机器人在商业领域正在获得巨大的吸引力。 智能机器人技术的使用具有许多优势,包括提高效率、精度和成本效益。当与尖端技术相结合时,智能机器人可以有效克服实施挑战。 近年来,各行业的企业纷纷利用人工智能(AI 、机器学习和物联网(IoT 等先进技术来优化...
-
通义千问72B模型荣登大模型评测平台OpenCompass榜首
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。 OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的...
-
AI 绘画 API 超详细使用教程 - 附微信小程序接入代码
写在前面 【AI绘画/AI图像生成】已成为现下炙手可热的话题,AI 大模型训练的成本高昂,算法研究时间周期较长,对于大多数人来说,自研一套算法模型还是非常困难的,因此 AI 绘画 API 就应运而生,直接调用 AI 绘画 API 就能轻松将先进的图文...
-
如何在Python中使用ChatGPT API处理实时数据
译者 | 李睿 审校 | 重楼 OpenAI公司推出的GPT如今已经成为全球最重要的人工智能工具,并精通基于其训练数据处理查询。但是,它不能回答未知话题的问题,例如: 2021年9月之后的近期事件 非公开文件 来自过去谈话的信息 当用户处...
-
美版权局再次拒绝为AI生成的作品提供版权保护
美国版权局审查委员会最近第三次拒绝注册一件由生成人工智能部分创作的艺术品,强调其缺乏“人类创作者属性”,因此无法主张版权保护。 此次拒绝涉及艺术家Ankit Sahni提交的一份版权申请,他试图注册一幅名为“SURYAST”的二维艺术品。Sahni使用了一...
-
CSDN AI写作助手上线了!你会使用吗?
很高兴听到CSDN AI写作助手上线了,它的功能确实十分强大。作为一名AI语言模型,它可以帮助用户快速创作文章,提高写作效率。此外,它还可以作为对话式AI回答你的问题,进一步提高生产力。 我的使用心得与建议如下: 掌握关键词和主题。在使用AI写作助...
-
首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性...
-
由谷歌著名人工智能论文两位共同作者创立的 Essential AI 获得 5700 万美元融资
据彭博新闻报道,由两位谷歌资深人士创立的人工智能初创公司 Essential AI 已从隐秘状态中浮现,获得了 5650 万美元的新融资。 Essential AI 开发了一项名为「企业大脑」的技术,该技术可以利用 AI 执行企业职能,如数据分析,并自动...
-
让工作效率提升10倍:十大AIGC工具评测【建议收藏】
AI技术的普及已经在近年来不断增长。这种技术已经改变了我们与电脑的互动方式,让我们能够更高效、更自然地完成任务。本文将展示10个基于ChatGPT和GPT-3 AI模型构建的最强大的资源,使您更容易充分利用它们的潜力。因此,如果您想利用AI技术改进生活或工...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
Output 推出 Co-Producer:AI 驱动的 Pack Generator 为音乐制作人提供探索灵感的新途径
音乐创作软件公司 Output 今天宣布推出 Co-Producer,这是一项生成式 AI 技术,旨在增强音乐制作中的人类创造力,而非取代它。Co-Producer 的首个工具是 Pack Generator,它允许任何人通过简单的文本提示创建独特的免版税...
-
赶上ChatGPT的车,百度文心一言和阿里通义千问上线
百度“文心一言”,地址:https://yiyan.baidu.com 阿里“通义千问”,地址:https://tongyi.aliyun.com 以下介绍来自官方: 一、“文心一言”介绍: 你好,我是文心一言 ERNIE Bot 作为一个人工...
-
微软发文:27 亿参数的 Phi-2 AI 模型性能优于谷歌 32 亿参数的 Gemini Nano-2
12 月 13 日消息,微软公司今天发布新闻稿,表示旗下的 Phi-2 2.7B 模型,在多个方面都优于谷歌发布的 Gemini Nano-2 3.2B。 Phi-2 2.7B 模型 IT之家今年 11 月报道,微软在 Ignite 2023 大会上,宣...
-
Cohere发布“构建自己的连接器” 助企业利用Slack、Google Drive数据构建AI
近日,Cohere发布了“构建自己的连接器(build-your-own connectors)”功能,该功能允许企业安全地连接存储在Slack、Google Drive等第三方应用上的公司数据到其大型语言模型(Command LLM 。据称,这是一项独特...
-
Stable Diffusion XL搭建
本文参考:Stable Diffusion XL1.0正式发布了,赶紧来尝鲜吧-云海天教程 Stable Diffision最新模型SDXL 1.0使用全教程 - 知乎 1、SDXL与SD的区别 (1)分辨率得到了提升 原先使用SD生成图片,一般都...
-
Meta Ray-Ban智能眼镜引入AI,可识别物体和语言翻译
Meta公司最新宣布将在其Ray-Ban智能眼镜上推出引人注目的多模态AI功能,为用户提供更智能、交互式的体验。该功能利用眼镜的摄像头和麦克风,使Meta的AI助手能够感知用户周围的视听信息,并做出相应的反应。 马克扎克伯格在Instagram的一段视频中...
-
LLaMA及其子孙模型概述
文章目录 LLaMA Alpaca Vicuna Koala Baize (白泽 骆驼(Luotuo BELLE Guanaco LLaMA 与原始transformer的区别: 预归一化[GPT3]。为了提高训练稳定性,对...
-
马斯克的AI工具Grok套壳ChatGPT?
埃隆•马斯克旗下人工智能公司xAI最新推出了名为GroK的人工智能聊天机器人,并面向美国地区的Premium+ X 用户开放。据悉,Grok采用了名为Grok-1的模型,与目前OpenAI旗下的ChatGPT所使用的GPT-4模型不同。 但越来越的用户...
-
微软发布小型语言 AI 模型 Phi-2,性能优于 Llama 2、Mistral 7B
微软研究院当地时间周二宣布其 Phi-2 小型语言模型(SML),这是一款文本到文本的人工智能程序,据 X 平台的一篇帖子称,它「足够小,可以在笔记本电脑或移动设备上运行」。 Phi-2 拥有 27 亿参数,性能堪比其他更大的模型,包括 Meta 的 L...
-
llama.cpp部署通义千问Qwen-14B
llama.cpp是当前最火热的大模型开源推理框架之一,支持了非常多的LLM的量化推理,生态比较完善,是个人学习和使用的首选。最近阿里开源了通义千问大语言模型,在众多榜单上刷榜了,是当前最炙手可热的开源中文大语言模型。今天在github上看到前几天llam...
-
LLM-LLaMA中文衍生模型:Chinese-LLaMA-Alpaca【扩充词表、Lora部分参数预训练、微调】
GitHub:GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 中文LLaMA模型...
-
确保贵企业的数据为生成式AI做好准备的七个方法
译者 | 布加迪 审校 | 重楼 大家都想利用生成式AI和大语言模型的力量,但这里有一个难题。让AI满足很高的期望需要高质量的实用数据,这正是许多组织的不足之处。 麦肯锡最近一份由Joe Caserta和Kayvaun Rowshankish共同撰写的...
-
面对AI灭世主义:智能并非全部
AI灭世主义者早就迷失在一种伪装成贝叶斯分析的宗教当中。这是Oxide公司CTO在接受TNS采访时说的。 图片 译自Bryan Cantrill on AI Doomerism: Intelligence Is Not Enough,作者 David C...
-
【Video-LLaMA】增强LLM对视频内容的理解
Paper:《Video-LLaMA : An Instruction-tuned Audio-Visual Language Model for Video Understanding》 Authors: Hang Zhang, Xin Li, Lid...
-
【AIGC 视角】 可信计算调研报告
一、概述 可信计算是指在计算机系统中,通过硬件、软件和协议等多种手段,保证计算机系统的安全性、完整性和可靠性。可信计算主要包括以下几个方面: 安全启动:确保系统从启动开始就是可信的,并且没有被篡改或攻击。 安全运行环境:提供一种安全的执行环境,防止恶...
-
Stable diffusion和Midjourney之间的抉择
首先,这两个工具的差异体现在成本和出图方面。就成本而言,Stable diffusion是一个免费使用且开源的工具,可以进行本地部署但需要较高的电脑配置。虽然其绘制图像的速度还算快捷,但是必须使用稳定的网络连接才能正常运行。 与之相比,Midjourne...
-
4款唯美大气照片展示PR电子相册模板视频素材(也适用于AI绘画图片作品展示)
唯美浪漫幻灯片视频模板|电子相册照片/AI图片展示PR模板 ? https://prmuban.com/36642.html AI图片展示|电子相册照片回忆录视频素材PR模板 ? https://prmuban.com/36643.html AI创作MD...
-
基于LoRA微调部署Stable Diffusion【免费试用阿里云】
文章目录 Stable Diffusion介绍 环境及资源准备过程 交互式建模(PAI-DSW)的试用 在创建的工作空间中创建实例 Stable Diffusion的Web-UI部署 下载stable-diffusion-webui开源库...