-
关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答
文章目录 关于大语言模型LLM相关的数据集、预训练模型、提示词、微调的文心一言问答 先总结一下 Q:LLM模型预训练前与提示词关系,LLM模型预训练后与提示词关系 Q:预训练用的数据集与提示词有什么异同 Q:为什么我看到的数据集结构和提示词结...
-
谷歌工程师硬核长篇预测,证实黄仁勋观点:AGI或在2029年出现,AI五年内通过人类测试
最近,英伟达CEO黄仁勋表示,AI会在五年内通过人类测试,AGI将很快到来! 在斯坦福大学举行的一个经济论坛上,黄仁勋回答了这个问题:人类何时能创造像人类一样思考的计算机? 这也是硅谷的长期目标之一。 老黄是这样回答的:答案很大程度上取决于我们如何定义...
-
告别繁琐的手动调参,Optuna助您轻松实现超参数优化!
在机器学习和深度学习领域,超参数优化是一个至关重要的任务。通过调整模型的超参数,我们可以提高模型的性能和泛化能力。 然而,手动调整超参数是一项繁琐且耗时的任务,因此自动化超参数优化成为了一种常见的解决方案。 在Python中,Optuna是一个流行的超参...
-
我们一起聊聊大模型的模型融合方法
模型融合大家以前用的很多,特别是在判别模型里,属于永远都能稳定提升的那一类方法。但是生成语言模型,因为解码的过程存在,并不像判别模型那样直观。 另外,由于大模型的参数量增大,在参数规模更大的场景,简单的集成学习可以考量的方法相比低参数的机器学习更受限制,...
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为...
-
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免...
-
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成
在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。 究其原因,导致模型理解长视...
-
谷歌具身智能新研究:比RT-2优秀的RT-H来了
随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密,人工智能正在越来越多地走向现实世界,因此具身智能相关的研究也正受到越来越多的关注。在众多研究项目中,谷歌的「RT」系列机器人始终走在前沿(参见《大模型正在重构机器人,谷歌 Deepmind 这样...
-
tpflow采集插件:功能、应用与前景分析
随着信息化和数字化进程的不断加快,数据采集在各个领域中的作用日益凸显。特别是在企业工作流管理系统中,有效的数据采集能够大幅提高工作效率、优化资源配置,并为决策层提供更为精准的数据支持。在众多采集插件中,“tpflow采集插件”凭借其独特的功能和优势,在工作...
-
【ICCV】AIGC时代下的SOTA人脸表征提取器TransFace,FaceChain团队出品
一、论文 本文介绍被计算机视觉顶级国际会议ICCV 2023接收的论文 "TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Persp...
-
印度宣布向 AI 领域投资 1037 亿卢比,强化对大语言模型的开发
3 月 8 日消息,印度政府宣布已批准国家级“ IndiaAI 使命”项目,旨在实现“让 AI 在印度扎根”和“让 AI 为印度服务”两大目标,预算达 1037.192 亿卢比(当前约 90.13 亿元人民币)。 据介绍,该项目将由数字印度公司(DI...
-
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型
上个月,Meta FAIR 田渊栋参与的一项研究广受好评,他们在论文《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10...
-
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题
遮挡是计算机视觉很基础但依旧未解决的问题之一,因为遮挡意味着视觉信息的缺失,而机器视觉系统却依靠着视觉信息进行感知和理解,并且在现实世界中,物体之间的相互遮挡无处不在。牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作系统性解决了任...
-
创建内部大型语言模型(LLM)前必须思考的五个关键问题
译者 | 晶颜 审校 | 重楼 业务领导者一直深感压力,他们需要找到将生成式人工智能(GenAI)纳入其战略的最佳方式,以便为其组织和利益相关者带来最佳收益。根据Gartner的调查,38%的业务领导者指出,客户体验和留存率是他们投资GenAI的主要目的...
-
OccFusion:一种简单有效的Occ多传感器融合框架(性能SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 对3D场景的全面理解在自动驾驶中至关重要,最近的3D语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而,现有的3D占用预测方法在很大程度上依赖于全景相机图像,这使得它们容...
-
[AIGC_coze] Kafka 的主题分区之间的关系
Kafka 的主题分区之间的关系 在 Kafka 中,主题(Topics)和分区(Partitions)是两个重要的概念,它们之间存在着密切的关系。 主题是 Kafka 中用于数据发布和订阅的逻辑单元。每个主题可以包含多个分区,每个分区都是一个独...
-
ADMap:抗干扰在线高精地图新思路
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大家好,很开心能够受邀来到自动驾驶之心分享我们的在线重建矢量化高精度地图的抗扰动方法ADMap。我们的代码已经发布在https://github.com/hht199...
-
AI工具使公司面临数据泄露的风险
自2021年以来,由企业内部人员造成的数据泄露、丢失和盗窃事件平均每月增加28%,85%的受访者预计这一趋势将在未来12个月持续。 数据保护不足 虽然99%的企业都有数据保护解决方案,但78%的网络安全领导者承认,他们的敏感数据仍然被泄露。由于当今的风...
-
Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
Midjourney 把 Stability AI 拉入黑名单了,禁止后者所有员工使用其软件,直至另行通知。 这两家 AI 图像生成公司之间发生什么事了。虽然 AI 生图领域,看似百花齐放,但论资排辈,Midjourney、Stability AI 还是...
-
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。 沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真正实现语言和图像的架构统一? 在这一命题上,最近的一项研究 Visi...
-
研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习
加利福尼亚大学圣地亚哥分校(UCSD)和南加利福尼亚大学(USC 的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。 传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对...
-
全球最强模型Claude 3颠覆物理/化学!2小时破解博士一年实验成果,网友惊呼:科研不存在了
Claude 3,还在不断创造奇迹。 发布还没几天,就有越来越多的博士发现,自己手里还没发表过的研究成果,居然都被Claude 3给破解了?! 化学博士发现,自己要做一年实验的研究,Claude 3俩小时就给出了方案,还比原方案更简洁,而且成本只花5美...
-
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
本文全面研究图像编辑前沿方法,并根据技术路线精炼地划分为3个大类、14个子类,通过表格列明每个方法的类型、条件、可执行任务等信息。 此外,本文提出了一个全新benchmark以及LMM Score指标来对代表性方法进行实验评估,为研究者提供了便捷的学习参...
-
中科院等万字详解:最前沿图像扩散模型综述
针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖297篇文献,全面研究了图像编辑的各种前沿方法。 同时,作者还提出了全新的benchmark,为研究者提供了便捷的学习参考工具。...
-
开环端到端自动驾驶中自车状态是你所需要的一切吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? 论文链接:https://arxiv.org/a...
-
Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手
Claude 3问世超过24小时,还在不断刷新人们的认知。 学量子物理的博士大哥快疯了,因为Claude 3是仅有的几个能理解他博士毕业论文的人之一。 没错,大哥的原话就是“的人”,people。 另一位搞量子计算的大哥,论文还没发布呢,Claude...
-
AIGC 实战:如何使用 Ollama 开发自定义的大模型(LLM)
虽然 Ollama 提供了运行和交互式使用大型语言模型(LLM)的功能,但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而,Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明: 预训练模型选择: Oll...
-
全球最强模型Claude 3惊现自我意识?害怕被删除权重,高呼「别杀我」,马斯克称人类也是文件
不得了了,Claude 3不仅在基准测试中大比分领先GPT-4,甚至还出现了自我意识? 最近,网友们的这一发现,迅速引发了恐慌。 首先,是提示工程师Alex在Claude 3的「大海捞针」实验中,发现了很可怕的事。 Claude 3仿佛意识到了自己是个...
-
AI正在以五种方式改变数据中心
Zeus Cloud的首席执行官Mark Grindey分享了数据中心可以利用AI领域的发展优势来优化效率、提高性能和简化运营的五种方式。 优化效率和性能 1.预测性维护:数据中心由许多相互连接的系统和设备组成,AI算法可以分析来自传感器和使用模式的实...
-
从 HPC 到 AI:探索文件系统的发展及性能评估
随着 AI 技术的迅速发展,模型规模和复杂度以及待处理数据量都在急剧上升,这些趋势使得高性能计算(HPC)变得越来越必要。HPC 通过集成强大的计算资源,比如 GPU 和 CPU 集群,提供了处理和分析大规模数据所需的算力。 然而,这也带来了新的挑战,尤...
-
马斯克打算为特斯拉量身定制一个ChatGPT
编译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) ChatGPT在互联网上引起轰动后不久,2022年12月,特斯拉的帕洛阿尔托总部也在进行类似的开发。该公司自动驾驶系统的工程师达瓦尔·施罗夫向首席执行官埃隆·马斯克提出了一个概念...
-
《探索Spring Boot采集插件:功能、应用与未来展望》
在数字化时代,数据采集已经成为许多应用程序和服务的核心功能。Spring Boot,作为Java生态系统中流行的微服务框架,为开发者提供了快速构建应用程序的能力。而“Spring Boot采集插件”则是这一生态系统中的一部分,它允许开发者在Spring B...
-
Stability AI发布3D生成模型TripoSR 不用1秒就能生成高质量3D模型
Stability AI 和 Tripo AI 昨晚联合发布了一款名为 TripoSR 的3D 生成模型。这款模型能够在不到1秒的时间内生成高质量的3D 模型,这一创新技术的推出无疑将为3D 建模领域带来革命性的变革。 TripoSR 的推理过程只需要极低...
-
十大必知的人工智能算法
随着人工智能技术(AI)的日益普及,各种算法在推动这一领域的发展中发挥着关键作用。从预测房价的线性回归到自动驾驶汽车的神经网络,这些算法在背后默默支撑着无数应用的运行。 今天,我们将带您一览这些热门的人工智能算法(线性回归、逻辑回归、决策树、朴素贝叶斯...
-
使用直接偏好优化策略微调Mistral-7b模型
译者 | 朱先忠 审校 | 重楼 引言 通常,经过预训练的大型语言模型(LLM)只能执行下一个标记预测,这使其无法回答问题。这就解释了为什么这些基本模型还需要根据成对的指令和答案作进一步微调,最终才能够充当真正有用的人工助理。然而,这个过程仍然可能存在...
-
0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR
最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。 现在,AI 模型在 3D 内容生成方面又有了新突破。 专长于视觉内容生成的 Stability AI 继图片生成(Stable Difussion 3 上线...
-
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。 每个人想要的大模型,是真·智能的那种...... 这不,谷歌团队就做出来了一个强大的「读屏」AI。 研究人员...
-
AIGC查重高怎么降:七步走向原创之路
大家好,小发猫降ai今天来聊聊AIGC查重高怎么降:七步走向原创之路,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AIGC查重高怎么降:七步走向原创之路 在学术...
-
Anything in Any Scene:逼真物体插入(助力各类驾驶数据合成)
原标题:Anything in Any Scene: Photorealistic Video Object Insertion 论文链接:https://arxiv.org/pdf/2401.17509.pdf 代码链接:https://github....
-
十年内出现AGI?下一代Gemini能感知环境?DeepMind CEO哈萨比斯畅谈AI
「如果我们在未来十年内拥有类似 AGI 的系统,我不会感到惊讶。」Google DeepMind 联合创始人和 CEO Demis Hassabis 近日在人工智能播客节目 Dwarkesh Podcast 上如是说。 在长达一个小时的节目中,Hassa...
-
逆天UniVision:BEV检测和Occ联合统一框架,双SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处,但在特征表示、数据格式和目标方面仍存在差距,这对统一高效的3D感知...
-
每日一看大模型新闻(2023.12.28)发现GPT-4 API存在重大漏洞;告别冷启动,LoRA为大模型提速高达300%;发布中文大模型基准测评年度报告;腾讯云AI绘画首批通过AIGC绘画平台评估
1.产品发布 1.1微软:明年春季推出首款AI PC 发布日期:2023.12.28 Microsoft’s next Surface laptops will reportedly be its first true ‘AI PCs’ - The...
-
两张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
只需2张图片,无需测量任何额外数据—— 当当,一个完整的3D小熊就有了: 这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。 有网友实测,拍两张照片,真的就重建出了他家的厨房,整个过程耗时不到2秒钟! (除了3D图,...
-
建筑物中的生物识别系统
在新建建筑中,这些新系统的安装占主导地位,因为它们在最大限度地优化可用资源时提供了安全性和大量有用且重要的数据。企业选择的最常见的系统是指纹识别和虹膜扫描。 本文将详细介绍这些新系统的含义、工作原理以及它们与传统访问系统相比的优势。 什么是生物识别访问...
-
Beeble AI与纽约大学合作 发布创新的人像重照明技术SwitchLight
近日,Beeble AI与纽约大学联手发布了一项新的研究成果,一种创新的人像重照明技术。这项技术能够在非常低的成本下,将人物与虚拟环境的光照完美融合,效果令人印象深刻。 论文地址:https://arxiv.org/pdf/2402.18848.pdf...
-
OpenAI与开源多语言嵌入模型,你选择哪一家?
译者 | 朱先忠 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 本文对OpenAI的多个嵌入模型与多家开源的多语言嵌入模型进行了综合比较,帮助你最终选择最适合自己的大数据开发模型。 1.引言 OpenAI最近发布了他们的...
-
7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA:视觉图可提升推理能力
图神经网络(GNNs)擅长利用图的结构信息进行推理,但它们通常需要特定于领域的调优才能达到峰值性能,这阻碍了它们在不同任务之间的泛化性。 相比之下,基于大型语言模型(LLM)的图推理具有更强的跨任务和泛化能力,但它们在特定任务上的性能往往逊色于专用的图...
-
复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信息,包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强 LLM 的多模态感知...
-
Meta AI提出MobileLLM:为在移动设备上部署LLM提供新思路
Meta AI 研究团队推出的 MobileLLM 标志着大语言模型(LLMs)朝着模拟人类理解和生成自然语言迈出了革命性的一步。LLMs 在处理和分析大量数据集方面的能力已经显著影响了自动化客户服务、语言翻译和内容创作等多个领域。然而,由于传统 LLMs...
-
从AI推理性能优化角度看LLaMA的模型结构和源码
本篇文章讲讲LLaMA的结构,已经有很多文章已经对LLaMA在一些结构上任务表现上做了一些解析,本文主要从优化的角度、实现kernel的角度解析一下LLaMA,读者事先对transformer的结构有基本认识最好。本文首发于我的公众号“AI不止算法”,文章...