-
算法在 58 画像平台建设中的应用
一、58 画像平台建设背景 首先和大家分享下 58 画像平台的建设背景。 1. 传统的画像平台 传统的思路来看,建设用户画像平台依赖数仓建模能力,整合多业务线数据,构建准确的用户画像;还需要数据挖掘,理解用户行为、兴趣和需求,提供算法侧的能力;最后,...
-
2024年,端到端自动驾驶在国内是否会有实质性的突破和进展?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 毫不意外,随着Tesla V12在北美大范围推送以及凭借其良好的表现开始获得越来越多用户的认同,端到端自动驾驶也成为了自动驾驶行业里大家最为关注的技术方向。最近有机会和很多行业中的一流工程师,产品经理,...
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。...
-
MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压DeepMind
一夜之间,机器学习范式要变天了! 当今,统治深度学习领域的基础架构便是,多层感知器(MLP)——将激活函数放置在神经元上。 那么,除此之外,我们是否还有新的路线可走? 就在今天,来自MIT、加州理工、东北大学等机构的团队重磅发布了,全新的神经网络结构...
-
OpenAI Sora让创作者们工作轻松,他们还相信自己不会轻易被取代
5月6日消息,OpenAI文生视频工具Sora的早期测试者们似乎可以松口气了。他们并没有因为这款工具而出现即将被取代的恐慌,反而觉得它让他们的工作变得更加游刃有余。 今年2月,人工智能初创公司OpenAI正式推出了Sora,这款工具旨在“深入理解和模拟...
-
工业4.0革命:预测性维护成功的四阶段蓝图
为工业4.0设计预测性维护解决方案代表着企业维护和运营方式的范式转变。通过使用先进的预测性维护技术,主动预防运营挑战是这个新工业时代的关键方面。这些解决方案不仅有助于获取新的收入来源和节省运营成本,而且在防止停工和生产停机方面也发挥着重要作用。 尽管机...
-
指标+AI:迈向智能化,让指标应用更高效
近日,以“Data+AI,构建新质生产力”为主题的袋鼠云春季发布会圆满落幕,大会带来了一系列“+AI”的数字化产品与最新行业沉淀,旨在将数据与AI紧密结合,打破传统的生产力边界,赋能企业实现更高质量、更高效率的数字化发展。会上,袋鼠云业务总经理申杭带来了以...
-
AI风险发现中的十种方法
除了聊天机器人或个性化建议的喧嚣之外,人工智能预测和消除风险的强大能力正在组织中获得发展动力。随着大量数据的激增和监管的收紧,传统的风险评估工具在重压下变得举步维艰。 在这样的背景下,利用人工智能的风险管理能力可确保遵守不断变化的法规并积极应对不可预见的...
-
革新LLM微调之道:全方位解读PyTorch原生库torchtune的创新力量与应用价值
在人工智能领域,大语言模型(LLMs)正日益成为研究和应用的新热点。然而,如何高效、精准地对这些庞然大物进行调优,一直是业界和学术界面临的重要挑战。近期,PyTorch官方博客发布了一篇关于TorchTune的文章,引起了广泛关注。TorchTune作为...
-
建筑业中的数字孪生技术应用及未来展望
...
-
GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo
够刺激,GPT-4竟然当众被“揍”了,甚至连还手的机会都没有: 是的,就是在一场《街头霸王》游戏现场PK中,发生了这样的名场面。 而且二者还是不在一个“重量级”的那种: 绿人:由GPT-4操纵 红人:由一个端侧小模型操纵 那么这位又小又彪悍的选...
-
数据:三分之二制药业顶级公司禁止员工使用 ChatGPT
最近 ZoomRx 进行的一项调查显示,20家最大的制药公司中有三分之二禁止员工使用 ChatGPT,这是因为他们担心敏感内部数据的安全问题。 图源备注:图片由AI生成,图片授权服务商Midjourney 尽管 ChatGPT 在药物开发中有提高效率和效...
-
在线地图还能这样?MapTracker:用跟踪实现在线地图新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 太强了,在线高精地图还能用跟踪的方式来做!!!本文提出了一种矢量HD建图算法,该算法将在线高精建图公式化为跟踪任务,并使用memory latents的历史来确保随着时...
-
超越BEVFormer!CR3DT:RV融合助力3D检测&跟踪新SOTA(ETH)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文介绍了一种用于3D目标检测和多目标跟踪的相机-毫米波雷达融合方法(CR3DT)。基于激光雷达的方法已经为这一领域奠定了一个高标准,但是其高算力、高成本的缺陷制约了...
-
从0到1,聊聊货拉拉如何搭建数据指标体系
一、背景 指标体系是指一系列维度、有组织及结构的指标集合。构建指标体系主要是为公司业务目标落地做辅助决策,以及监控业务运行的稳定性情况等。 具体从业务、技术及产品三个视角来阐述指标体系构建中的痛点: 1. 业务视角: 可信任性:业务口径不一致,导致指...
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图像,可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常,这些对应关系是二维到二维的...
-
融汇11款AI工具构建完美应用
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 如您所见,人工智能(AI)应用在近年来得到了长足的发展。从语音助手到软件开发,人工智能已在我们的生活中无处不在,并得到了广泛应用。下面...
-
超越BEVFusion!DifFUSER:扩散模型杀入自动驾驶多任务(BEV分割+检测双SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多,工业界和学术界非常希望一个理想的感知算法模型,可以同时完成如3D目标检测以及基于BEV空间的语义分...
-
商汤科技将发布「日日新 SenseNova 5.0」大模型
商汤科技宣布,将于明日推出全新版本的「日日新5.0」,继续带来技术的创新和突破。 日日新(SenseNova)是商汤科技推出的大模型体系,包括自然语言处理模型 “商量”(SenseChat 、文生图模型 “秒画” 和数字人视频生成平台 “如影”(Sens...
-
4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源
蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。 西湖大学的研究人员利用Fo...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
基于因果推断的推荐系统:回顾和前瞻
本次分享的主题为基于因果推断的推荐系统,回顾过去的相关工作,并提出本方向的未来展望。 为什么在推荐系统中需要使用因果推断技术?现有的研究工作用因果推断来解决三类问题(参见 Gao et al.的 TOIS 2023 论文 Causal Inference...
-
基于图技术提升多模型协作性能
译者 | 朱先忠 审校 | 重楼 当今时代,各种人工智能模型的能力整合到一起已经释放出一股巨大的潜力。这种力量已经涉及到从需要视觉、语音、写作和合成等多种能力的复杂任务自动化到增强决策过程等诸多领域。然而,如何高效协调这些合作?无论在管理内部关系还是在管...
-
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
首位超越国际奥林匹克竞赛金牌得主的AI,刚刚诞生了! 印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者发现—— 通过「吴方法」,可以让AI变成和人类数学奥赛银牌得主同样的水平,而「AI数学大师」AlphaGeometry,则直接超越了IMO金牌...
-
激发大语言模型空间推理能力:思维可视化提示
大语言模型(LLMs)在语言理解和各种推理任务中展现出令人印象深刻的性能。然而,它们在人类认知的关键一面——空间推理上,仍然未被充分研究。人类具有通过一种被称为 心灵之眼 的过程创造看不见的物体和行为的心智图像的能力,从而使得对未见世界的想象成为可能。...
-
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法
在深度神经网络时代,深度神经网络(DNNs)在视觉分类任务中展现出了卓越的准确性。然而,它们对额外噪声,即对抗性攻击,表现出了脆弱性。先前的研究假设这种脆弱性可能源于高准确度的深度网络过度依赖于与纹理和背景等无关紧要且不鲁棒的特征。 最近的AAAI 20...
-
抱抱脸Open了OpenAI的秘密武器,网易参与复现
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。 来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。 最终成功展示...
-
第一个能听懂人类语气的AI火了,网友:感觉在和真人交谈
第一个能听懂你说话的语气、有“情商”的AI火了! 这个AI名为EVI(Empathic Voice Interface),它不仅能够能够理解用户的语气,还会为每个词增加意义。 对话中的每句话,它都能可视化含惊讶量、含悲伤量、含兴奋量…… 然后根据用户的声...
-
九.pandas绘图基础
目录 九.pandas绘图基础 1-柱状图 --参数stacked=True堆积 --参数figsize=(宽,高 --自定义横坐标 --设置字体&显示负号 2.箱型图 3. 折线图 九.pandas绘图基础 Pa...
-
[AIGC] 主流工作流引擎对比与适用场景介绍
主流工作流引擎对比与适用场景介绍 工作流引擎在业务流程管理中扮演着重要的角色,它可以帮助组织将复杂的工作流程自动化,降低错误率,提高工作效率。目前市面上有许多优秀的工作流引擎,各自都有着独特的优点和适用的场景。本文将介绍几款主流的工作流引擎,包括它...
-
龙盈智达&Fabarta:基于图智能和 AIGC 技术的金融营销解决方案
导读 在金融行业的营销活动中,如何获取潜在客户以及判定企业风险是银行重点关注的方向。本方案基于 ArcGraph 图数据库和图智能分析技术,帮助企业筛选潜在客户,通过股权穿透、实控人分析自动识别风险。通过大模型企业知识中台,用户可以利用自然语言对话的方式查...
-
大模型中常用的注意力机制GQA详解以及Pytorch代码实现
分组查询注意力 (Grouped Query Attention 是一种在大型语言模型中的多查询注意力 (MQA 和多头注意力 (MHA 之间进行插值的方法,它的目标是在保持 MQA 速度的同时实现 MHA 的质量。 这篇文章中,我们将解释GQA的...
-
在ChatGPT中,能用DALL·E 3编辑图片啦!
本文经 AIGC开放社区公众号授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 4月3日,OpenAI开始向部分用户,提供在ChatGPT中的DALL·E...
-
探索使用对比损失的孪生网络进行图像相似性比较
简介 在计算机视觉领域,准确地测量图像相似性是一项关键任务,具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统,有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合,为以数据驱动方式学习图像相似性提供了强大的框架。在...
-
让Siri不再智障!苹果定义新的端侧模型,“大大优于GPT-4,摆脱文本,可视化模拟屏幕信息,最小参数模型相较基线系统仍提升5%
撰稿丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 总被用户吐槽“有点智障”的Siri有救了! Siri自诞生以来就是智能语音助手领域的代表之一,但很长一段时间里,其表现并不尽如人意。然而,苹果的人工智能团队最新...
-
更好、更安全、更不依赖OpenAI,微软的AI新动向,推出大模型安全工具Azure AI
编译丨伊风 出品 | 51CTO技术栈(微信号:blog51cto) 对生成性人工智能(generative AI)的需求正不断增长,而对LLM安全和可靠性的担忧也变得比以往任何时候都更加突出。企业希望能确保为内外部使用而开发的大规模语言模型(LLM)...
-
突破障碍:生成式人工智能如何重塑数据分析领域
在当今市场状况下,企业必须不断寻求新方法来利用技术突破以保持领先地位。生成式人工智能是一个近年来迅速扩展的突出领域。 Gartner预测,到2026年,超过80%的组织将使用生成式人工智能API、模型或应用程序,而2023年这一比例不到5%。生成式人工智...
-
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
「扩散模型」也能攻克算法难题? 图片 一位博士研究人员做了一个有趣的实验,用「离散扩散」寻找用图像表示的迷宫中的最短路径。 图片 作者介绍,每个迷宫都是通过反复添加水平和垂直墙生成的。 其中,起始点和目标点随机选取。 从起点到目标点的最短路径中,随机采样...
-
IT团队必须应对的商业智能六个挑战
商业智能(BI 使企业能够从大量数据中获得见解。但这样做需要克服一系列战略和战术挑战。 如今,各种类型的组织都被来自各种来源的数据淹没,试图理解所有这些数据不堪重负。因此,强大的商业智能(BI 策略可以帮助组织流程,并确保业务用户能够访问可操作的业务见...
-
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
CLIP长文本能力被解锁,图像检索任务表现显著提升! 一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。 △棕色文本为区分两张图的关键细节 Long-CLIP在保持CLIP原始特征空间的基础上,在图像生成等下游任务中即插...
-
OpenUI官网体验入口 AI自然语言UI设计可视化工具使用地址
OpenUI是一款旨在使UI设计及构建UI组件过程变得有趣、快捷和灵活的工具。OpenUI可用于测试和原型化下一代工具,在LLM的基础上构建强大的应用程序。用户可以使用想象力描述UI,然后实时查看渲染效果,要求进行更改,最终将HTML转换为React、Sv...
-
“真假难辨”!巧用NeRF生成的自动驾驶仿真数据
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的有前途的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式...
-
零基础用文心一言带你绘制神经网络矩阵相乘组合图
之前写过一些 ChatGPT 的使用体验,确实很好,省了很多事,用起来也方便。 > 代码看不懂?不会优化?ChatGPT 来帮你! > 偷个懒,用ChatGPT 帮我写段生物信息代码 > 1 分钟看 Cha...
-
CNC数据采集解决方案(2023杭州乐芯科技)
IOT数据采集平台产品是为满足工业4.0大型集团工厂推出的新一代数据采集平台级产品,可满足单一平台(一个服务器)同时采集各类设备,同时兼容各种工业数据采集协议,单服务器压力测试达1000台,已经稳定在大型集团用户稳定运行。实现各种工业设备数据采...
-
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该模型仅开源 5 天 GitHub 即收获 1k 星,在 Twitter 更是「火出圈」,吸引了大量博主二创,浏览量总量达到 300K。 目前 Champ 已经开源...
-
量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一,现有的算法在远距离范围下的感知表现依然较差。为此,我们提出了P-MapNet,其中的“P”强调我们专注于融合地图先验以...
-
AIGC ChatGPT 4 带你了解数据仓库、数据集市、数据湖、数据中台之间的关系
1 数据仓库: 数据仓库(Data Warehouse)是一个组织为了支持决策制定而创建的主题性、集成性、时间相关性和稳定性的集中数据管理环境。数据仓库集中存储来自组织的各个业务部门的大量数据,有助于执行查询和分析操作。 数据仓库的主要特点包括:...
-
Webflow官网体验入口 AI可视化编码网站建设工具使用地址
Webflow是一款领先的可视化网页设计和开发工具。它允许用户在可视化画布上设计网站布局和样式,并自动生成优化的HTML、CSS和JavaScript代码。Webflow提供强大的定制能力,可以创建复杂的动画、丰富的内容页面和自定义组件。它还提供内容管理、...
-
15个推荐开源免费图像标注工具
图像标注是向图像添加标签或注释的元数据,使图像上的内容具有上下文含义。这个过程在机器学习中具有重要意义,助于在训练视觉模型过程中准确地识别图像中的元素。 视觉模型最终的用途也非常广泛,例如,帮助车辆识别道路上的不同物体或障碍物、通过对医学图像的识别帮助疾...
-
Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会
技术的发展总是伴随着被滥用的风险,从ChatGPT到最近发布的文本转视频工具Sora,AI生成的内容越是逼真,被滥用的风险也就越高。 仅仅一年前,大家还在嘲笑AI生成的「威尔史密斯吃意大利面」不自然,手部、嘴部、面条没有一个真实的;但现在的顶级AI模型已...