-
研究人员使用特殊图像“毒害”人工智能
DALL-E、Midjourney和Stable Diffusion等人工智能生成艺术工具的兴起引发了激烈的辩论和争议。这些系统可以通过在互联网上收集的大量数据集上进行训练,简单地根据文本提示创建真实感图像和艺术。然而,这引发了人们对侵犯版权、滥用艺术家...
-
开源社区有望成为OpenAI人事震动的最大赢家
美国当地时间11月20日上午,微软出人意料地聘请了OpenAI前CEO奥特曼和OpenAI总裁格雷格·布罗克曼,这一战略决定似乎是微软试图尽其所能摆平由OpenAI的董事会解雇奥特曼造成的混乱局面。 OpenAI政变的剧情一直在发展,几名研究人员已经辞...
-
DeepMind推出OPRO技术,可优化ChatGPT提示
在最新的AI研究报道中,Google DeepMind推出了一项名为“优化通过提示(OPRO)”的技术,将大型语言模型(LLM 作为其自身提示的优化器。该方法旨在通过自然语言描述问题,指导LLM生成和改进解决方案,从而提高提示性能。 OPRO的工作方式相对...
-
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结果。对于他们来说,理解人工智能根据医学影像给出的判别,需要增加额外的认知成本。 为了增强医生对辅助医疗的人工智能之间的信任,让 AI...
-
微软230页报告,像素级评估GPT-4前沿科研能力:潜力无限速速上车!
LLM作为研究工具,能否帮助科学研究带来新的突破? 今天微软AI4Science Research抛出一篇230页的重磅论文,告诉所有的科研人员: LLM(GPT-4)太强了,赶快想办法用起来! 论文地址:https://arxiv.org/abs/2...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
GPT-4不会图形推理?“放水”后准确率依然只有33%
GPT-4的图形推理能力,竟然连人类的一半都不到? 美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。 而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。 △虚线表示16项任务的平均表现 这项实验结果发表后,迅速在...
-
“ChatGPT之父被开”事件大结局 奥特曼加入微软领导新团队
上周末,OpenAI的董事会发布了一则地震级的官方公告,宣布奥特曼将辞去首席执行官一职,并离开董事会,由技术主管米拉穆拉蒂接任,立即生效。董事会在博文中指出,经过审议审查过程,他们认为奥特曼在与董事会沟通中缺乏始终如一的坦诚,阻碍了董事会履行职责的能力,因...
-
纳德拉官宣OpenAI前CEO Altman和前总裁Brockman将加入微软
11月20日消息,据外媒报道,当地时间周一,微软CEO萨蒂亚·纳德拉(Satya Nadella)在社交平台X上宣布,OpenAI前CEO萨姆·阿尔特曼(Sam Altman 和前总裁格雷格・布罗克曼(Greg Brockman 将加入微软,领导一个新的高...
-
研究证实,最好的 ChatGPT 提示是高度情绪化的
一组研究人员发现,充满情感的LLM输入始终会产生更有用的反应。 对不同大型语言模型响应输入方式的新研究表明,确保您的ChatGPT 提示足够情绪化将帮助您从聊天机器人中提取最高质量的响应。 这些发现提出了一个问题,即ChatGPT是否已经发展成为通用人...
-
OpenAI创始人Sam Altman被解雇后的24小时
ChatGPT背后的公司OpenAI周五解雇了其首席执行官兼创始人Sam Altman,他惊人的离职给新兴的人工智能行业带来了冲击波。 该公司在一份声明中表示,内部调查发现,阿尔特曼并不总是对董事会诚实。 该公司在声明中表示:“阿尔特曼先生的离职是在董...
-
DiagrammerGPT:GPT-4主导的颠覆性双层文生图表模型
近期,北卡罗来纳大学提出了一项重大技术突破,通过将GPT-4充当“规划师”和“审计师”,构建了DiagrammerGPT框架,实现了文本描述生成科学图表的布局规划。该框架利用GPT-4的强大自然语言处理能力指导图表布局生成,创新性地设计了闭环反馈机制,通过...
-
GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了
GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。 最近,一篇题为《On the Road with GPT-4V (ision : Early Explorations of Visua...
-
马斯克呼吁OpenAI公布CEO阿尔特曼被解雇原因
11月20日消息,据外媒报道,在OpenAI董事会于上周五宣布解雇其CEO萨姆·阿尔特曼(Sam Altman)后,特斯拉CEO埃隆・马斯克(Elon Musk)呼吁OpenAI公布解雇阿尔特曼的原因。 据悉,OpenAI由马斯克、阿尔特曼、PayPal联...
-
Altman王者归来!强势要求解散董事会,OpenAI终极宫斗一触即发
从被扫地出门到王者回归,乔布斯用了12年,而Sam Altman,仅仅用了两天。 现在,Altman已经以胜利者的姿态重返OpenAI探讨自己的去留问题,并且对董事会提出了新的要求—— 「更换现有的董事会成员,并且得到证明自己并无过错的声明。」 简单来说...
-
GPT-4充当“规划师、审计师”,颠覆性双层文生图表模型
DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力,通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片,但在生成科学图表(柱状、直方、箱线、树状等)方面却略显不足。 这是因为模型在生成图表时会遗漏...
-
谷歌为什么输给了OpenAI?科技公司创始人兼谷歌前员工带你一探究竟
在当今的人工智能浪潮中,OpenAI这样的新兴公司引领了革命。 ——而GPT的一些关键部分:Transformer、强化学习(AlphaGo ) 和 多模态(Flamingo)却都是由Google发明的。 那么为什么,作为科技领域巨无霸的Google,却...
-
Meta 介绍 AI 图像编辑工具 Emu Edit / Video:使用 1000 万个数据集训练,号称远超竞品
IT之家 11 月 20 日消息,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是“Emu Edit”和“Emu Video”,适用领域包括照片和视频,目前 Meta 公布了这两项 AI 工具的更...
-
效果超越SDXL!港中大博士生推出超真实人像合成工具,训练用了3.4亿张图
为了让AI画出的人更加逼真,港中大博士生用了3.4亿张图像专门训练画人。 人物的表情、姿态,环境的空间关系、光线都能合理布局,可谓立体感十足。 就连爆火的SDXL也不是它的对手,话不多说,直接上图! 这个模型的名字叫HyperHuman,主打的就是一个...
-
「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR
多模态对比表示(multi-modal contrastive representation, MCR)的目标是将不同模态的输入编码到一个语义对齐的共享空间中。 随着视觉-语言领域中CLIP模型的巨大成功,更多模态上的对比表征开始涌现出来,并在诸多下游任...
-
OpenAI 董事会正在与 Sam Altman 就重返 CEO 岗位进行讨论
根据多位熟悉此事的人士透露,OpenAI 董事会目前正在与 Sam Altman 讨论,以让他重返公司担任首席执行官(CEO)。据了解,Altman 上周五突然被董事会无预警解职后,对于重返公司持「矛盾」态度,并希望进行重大治理变革。 2023 年 1...
-
Nature:大模型只会搞角色扮演,并不真正具有自我意识
大模型正变得越来越“像人”,但事实真是如此吗? 现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已! 无论是GPT-4、PaLM、Llama 2还是其他大模型,在人前表现得彬彬有礼、知书达理的样子,其实都只是...
-
OpenAI CEO被董事会罢免36小时事件梳理
11月19日消息,美国时间11月17日周五,正值中国深夜时分,OpenAI在官网发布了一篇博文,声明OpenAI创始人兼CEO 山姆·阿尔特曼(Sam Altman)突遭公司董事会罢免,公司首席技术官米拉·穆拉蒂(Mira Murati)被任命为临时CEO...
-
OpenAI 董事会正在与 Sam Altman 讨论重新担任首席执行官
据多位知情人士透露,OpenAI 董事会正在与 Sam Altman 讨论重返公司担任首席执行官的事宜。其中一位人士表示,奥特曼周五在没有任何通知的情况下被董事会突然解雇,他对回归感到“矛盾”,并希望进行重大的治理变革。 一位与 Altman 关系密切的...
-
stable diffusion实践操作-常见lora模型介绍
系列文章目录 本文专门开一节写Lora相关的内容,在看之前,可以同步关注:stable diffusion实践操作 文章目录 系列文章目录 前言 一、什么是lora? 1.1 lora 定义 1.2 lora的基本原理 1.2 通...
-
大模型「幻觉」,看这一篇就够了
大模型“幻觉”,终于有系统综述了! 一口气49页,详细阐述了幻觉定义、分类、导致幻觉的原因,还有检测幻觉、减轻幻觉的方法。 这篇最新综述来自哈工大和华为,一po出就在网上火得不行: 具体来说,文中用一套新的范畴框架来定义模型幻觉,并将其分为事实性幻觉、...
-
Stable Diffusion在各种显卡上的加速方式测试,最高可以提速211.2%
Stable Diffusion是一种基于扩散模型的图像生成技术,能够从文本生成高质量的图像,适用于CG,插图和高分辨率壁纸等领域。 但是它计算过程复杂,使得它的生成速度较慢。所以研究人员就创造了各种提高其速度的方式,比如Xformers、Aitempl...
-
230页长文,涵盖5大科学领域,微软团队使用GPT-4探索LLM对科学发现的影响
前不久,微软 DeepSpeed 团队启动了一个名为 DeepSpeed4Science 的新计划,旨在通过 AI 系统优化技术实现科学发现。 11 月 13 日,微软团队在 arXiv 预印平台发表题为《大型语言模型对科学发现的影响:使用 GPT-4...
-
如何使用 GitHub Copilot:提示、技巧和用例
生成式人工智能编码工具正在改变开发人员处理日常编码任务的方式。从记录我们的代码库到生成单元测试,这些工具有助于加快我们的工作流程。然而,就像任何新兴技术一样,总是有一个学习曲线。因此,当人工智能驱动的编码助手无法生成他们想要的输出时,开发人员(无论是初学者...
-
IQ测试GPT完胜大学生;AIGC+表情包=?微软将GPT全面集成到Office;原作者对AI有声读物不太满意;GitHub今日热榜 | ShowMeAI资讯日报
? 『IQ测试』AI 完胜大学生 GPT-3 在智商(IQ)测试中的表现如何?UCLA(加利福尼亚大学洛杉矶分校)的研究人员发现,在衡量 IQ 的一系列推理测试中,自回归语言模型 GPT-3 的成绩已经明显优于普通大学生了。?论文 作者之一 Taylo...
-
2023戈登贝尔奖揭晓:Frontier超算「量子级精度」材料模拟获奖
戈登贝尔奖(ACM Gordon Bell Prize)设立于 1987年,由美国计算机学会颁发,被称为超算界的「诺贝尔奖」。该奖项每年颁发一次,用以表彰高性能计算领域取得的杰出成就。奖金 1 万美元,由高性能和并行计算领域先驱戈登·贝尔提供。 近日,在...
-
日本 Rapidus 与 Tenstorrent 达成合作 将共同开发 2 纳米 AI 芯片
Rapidus Corporation,一家专注于高级逻辑半导体的研究、开发、设计、制造和销售的公司,今天宣布已与专注于人工智能(AI)计算的下一代计算公司 Tenstorrent Inc. 达成合作协议,共同开发基于 2 纳米逻辑半导体的 AI 边缘设备...
-
让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入
AI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。 现在,清华大学联合HuggingFace的研究人员,推出了全新的绘图模型加速模块。 作者给出的体验版当中,点击生成按钮后,模型只用了几秒钟就绘制出了4张清晰的图像。...
-
OpenAI CEO和马斯克在线互怼:Grok真能叫板GPT-4吗?
最近,科技界的两大顶流——OpenAI CEO和马斯克“掐”起来了。 事情的起因是,Sam Altman发了一条推文,说“GPTs可以节省很多工作”,配图充满嘲讽意味,直指马斯克的AI聊天机器人Grok。 他让GPT Builder创建一个聊天机器人,以...
-
Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品
Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。 Lyria的设...
-
LCM-LoRA是什么?它如何让实时生成 AI 艺术成为现实
生成 AI 艺术已经成为新技术中最有趣和受欢迎的应用之一,例如 Stable Diffusion 和 Midjourney 等模型已经吸引了数百万用户的使用,此外,OpenAI 还在今年秋季将其 DALL-E3图像生成模型直接集成到其流行的 ChatGPT...
-
一文盘点2023人工智能进展,不止大模型而已
2023年大模型千帆竞发,除此外AI领域还有哪些新突破? 来来来,畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。 看完才知道: RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开...
-
谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。 AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。...
-
如何有效减少 AI 模型的数据中心能源消耗?
在让人工智能变得更好的竞赛中,麻省理工学院(MIT)林肯实验室正在开发降低功耗、高效训练和透明能源使用的方法。 在 Google 上搜索航班时,您可能已经注意到,现在每个航班的碳排放量估算值都显示在其成本旁边。这是一种告知客户其对环境影响的方式,并让他...
-
研究发现,ChatGPT 能理解和回应人类情感
自从 OpenAI 的聊天机器人 ChatGPT 走红以来,人们对人工智能(Artificial Intelligence,简称 AI)的兴趣达到了新的高度。虽然 AI 并不是一个新领域,但它确实是一个相对未被探索的行业,越来越多的公司正在投入资源进行研究...
-
TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现
11 月 16 日消息,业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司,近日联合组建了万亿参数联盟(Trillion Parameter Consortium,简称 TPC)。 由 DALL-E 3 生成 IT之家从报道中获悉,TPC...
-
AI如何颠覆价值300亿美元的市场研究行业?
全球市场研究行业市场规模高达300亿美元。这个在传统上被视为加快所有行业业务运营的关键基石,是决定企业战略和发展路径的关键。然而,如今这个行业正站在被AI颠覆的风口浪尖。迹象表明,AI将颠覆市场研究行业,提供实时洞察,重塑行业格局。 AI具有的非凡能力...
-
ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力
在大模型时代,高质量的代码生成已经强大到,让人惊叹。 从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。 然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。...
-
AIGC入门 - LLM 信息概览
在阅读本文之前,建议阅读文章:《GPT,GPT-2,GPT-3,InstructGPT的进化之路》 本文将介绍以下 LLM OPT LLaMa Alpaca Vicuna Moss chatGLM Baichuan Openbuddy 一、OPT...
-
新技术有效加速大规模人工智能模型的处理性能
麻省理工学院和英伟达的研究人员开发了两种技术来加速稀疏张量的处理,稀疏张量是一种用于高性能计算任务的数据结构。这些技术可以显著提高系统的性能和能效,例如驱动生成式人工智能的大规模机器学习模型。 张量(Tensors)是机器学习模型使用的数据结构。这两种...
-
比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平
今天我们提到大型语言模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到大型语言模型,ChatGPT 并不是第一个。 一年前,也就是 OpenAI 发布 ChatGP...
-
Yolo V8:深入探讨其高级功能和新特性
Yolo是一种计算机视觉模型,被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo,它是“You Only Look Once”的缩写,是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本,也是对之前版本的一种...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
解释:生成式 AI的工作机制与差异
像 ChatGPT 这样强大的生成式 AI 系统是如何工作的,它们与其他类型的人工智能有何不同? 快速浏览一下头条新闻,就会发现生成式人工智能如今无处不在。事实上,其中一些标题实际上可能是由生成式人工智能撰写的,例如 OpenAI 的 ChatGPT,...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...