-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。...
-
DeepSeek发布V2模型 GPT-4的性能白菜的价格
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同...
-
LeCun转发,AI让失语者重新说话!纽约大学发布全新「神经-语音」解码器
脑机接口(BCI)在科研和应用领域的进展在近期屡屡获得广泛的关注,大家通常都对脑机接口的应用前景有着广泛的畅享。 比如,由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活,还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展,...
-
国产开源MoE指标炸裂:GPT-4级别能力,API价格仅百分之一
最新国产开源MoE大模型,刚刚亮相就火了。 DeepSeek-V2性能达GPT-4级别,但开源、可免费商用、API价格仅为GPT-4-Turbo的百分之一。 因此一经发布,立马引发不小讨论。 从公布的性能指标来看,DeepSeek-V2的中文综合能力超越...
-
全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一
想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源 MoE 模型来了。 DeepSeek-V2 是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效...
-
用于时间序列概率预测的分位数回归
分位数回归满足这一需求,提供具有量化机会的预测区间。它是一种统计技术,用于模拟预测变量与响应变量之间的关系,特别是当响应变量的条件分布令人感兴趣时。与传统的回归方法不同,分位数回归侧重于估计响应变量的条件量值,而不是条件均值。 图(A : 分位数回归 分...
-
微调大语言模型的七个步骤
译者 | 布加迪 审校 | 重楼 在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。 这些功能强大的模型已彻底改变了我们处理自然语言任务的方法,在翻译、情绪分析和文本自动...
-
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好: 各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住: 甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒: 给气球放气机器狗也能保持平衡: 上述展示都是 1 倍速,没有经过...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱
【新智元导读】为了搞钱,微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海,各顶尖高校也紧随其后。Agent才是商业学术两开花的未来! 大模型发展至今早已火成了一个「概念」。 不管是学术界还是工业界,都要套上一层LLM的皮,方可彰显自己位于浪潮...
-
OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从一个新颖的3D MLLM架构开始,该架构使用稀疏查询将视觉表示提升和压缩到3D,然后将其输入LLM。 题目:OmniDrive: A Holistic LLM-Agent Framework for...
-
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
堂堂开源之王Llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。 在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间吗? 开源社区当然不会放过这个机会: 现在只需58行代码,任何Llama 3 70b的微调...
-
开发者福音!GitHub 推出AI原生开发环境Copilot Workspace,4大核心功能,预览版已发布!
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) AI编程界又有新神器了?GitHub 推出了人工智能原生开发环境 Copilot Workspace。 旨在让“任何开发者都可以用自然语言从想法开始,创建代码,再...
-
分享几个.NET开源的AI和LLM相关项目框架
现如今人工智能(AI)技术的发展可谓是如火如荼,它们在各个领域都展现出了巨大的潜力和影响力。今天大姚给大家分享4个.NET开源的AI和LLM相关的项目框架,希望能为大家提供一些参考。 https://github.com/YSGStudyHards/D...
-
看透物体的3D表示和生成模型:NUS团队提出X-Ray
项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html 论文地址:https://arxiv.org/abs/2404.14329 代码地址:https://github.com...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?
前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。 据现在可以查到的 WizardLM-2 发布信息,这是一个「真正媲美 GPT-4」的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。 该系列包括三个...
-
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。 也就是说,只要有想法,而且会打字,就可以...
-
Chat2DB:普通人也能用的AI驱动的数据开发和分析平台
Chat2DB是一个AI驱动的数据管理平台,旨在简化和增强数据库操作流程。该平台已经吸引了超过一百万开发者的使用,并在GitHub上获得了大量关注和支持。 全链路数据管理:Chat2DB支持无缝对接各种数据存储位置,无论是关系型还是非关系型数据库,都能实...
-
CharacterAI平替?Anime gf :一个本地且开源的“动漫女友”平台
Anime gf 是一个本地开源工具,为用户提供了与虚拟角色互动的平台,类似于 CharacterAI。Anime gf 提供了一个用户友好的界面,允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色,让每个虚拟角色都有自己的独特个性和语言风格。支持通...
-
AI小镇现在可以通过Llama3在本地运行 支持Convex、Ollama等服务器
a16z 团队开发的 AI 小镇是一个创新的虚拟城镇项目,现在可以通过 Llama3完全在本地运行。这个项目不仅支持 Convex、Ollama,还可以支持本地 Vite 网络服务器,为开发者提供了一个强大的平台来构建和定制自己的虚拟 AI 社区。 AI...
-
前谷歌CEO盛赞!GitHub Copilot 神秘竞争对手浮出水面,市值直逼独角兽!
各种编程Copilot彻底卷起来了,不止国外的微软、谷歌、Meta,国内的百度、阿里、商汤等AI巨头盯上了编程这块肥肉,不少初创公司也毅然决然的选择了这条赛道。 最近,那位曾经把Java带成Sun巅峰的CTO、前谷歌CEO 施密特(Eric Schmid...
-
元象开源首个多模态大模型XVERSE-V 支持任意宽高比图像输入
元象公司发布了首个多模态大型模型 XVERSE-V,并将其开源。这一模型支持任意宽高比的图像输入,并在多个权威评测中取得了优异的成绩。 相比其他开源和闭源模型,XVERSE-V 在综合能力上表现出色。该模型采用了融合整体和局部信息的策略,使其在识别和分析...
-
Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH
大模型力大砖飞,让LLaMA3演绎出了新高度: 超15T Token数据上的超大规模预训练,既实现了令人印象深刻的性能提升,也因远超Chinchilla推荐量再次引爆开源社区讨论。 与此同时,在实际应用层面上,另一个热点话题也浮出水面: 资源有限场景下...
-
流量回放平台 AREX 在携程的大规模落地实践
作者简介 携程AREX团队,机票质量工程组,主要负责开发自动化测试工具和技术,以提升质量和能效。 导语 AREX 是一款由携程开源的流量回放平台,孵化于机票BU内部。聚焦录制回放核心链路的建设,从基础方案建设到核心事业线的深入落地验证,在集团复杂业务场...
-
Cohere发布开发者工具包,加速企业生成式AI应用开发
Cohere 发布了一个开发者工具包,旨在加快企业生成式 AI 应用的构建过程。这个工具包包含了一个开源存储库,可以立即在任何云提供商上部署应用。它还包括设计用于 “构建独特应用并进行大规模部署” 的组件。 Cohere 的 Elaine Gao 和 B...
-
7个prompt小技巧,让你和AI的对话更有效
向AI工具提供的背景信息越详尽,收到的回复质量越高。 获取初步回答后进一步询问信息 在您越来越频繁地使用ChatGPT等工具时,您会很快意识到初次得到的答案并不总是可以直接采纳的。正如您会向他人提出更多问题以获取更多信息一样,与AI交互时也应如此。这次...
-
Open-Sora全面开源升级:支持16s视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。 生成个横屏圣诞雪景,发b站 再生成个竖屏,发...
-
点云处理绕不开的算法!如何高效搜索最近邻?开源工具库汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 一 ANN benchmark 链接:https://github.com/erikbern/ann-benchmarks 在高维空间中快速搜索最近的邻居是一个越来越重要的问题,尽管显然需要这样来推动...
-
首批中文版Llama3模型来了,解释成语、答弱智吧问题
最近,Meta 推出了 Llama 3,为开源大模型树立了新的标杆。 和以往的原始 Llama 模型一样,Llama 3 对中文的支持效果欠佳,经常会出现你用中文提问,它用英文或中文+英文回复的现象。因此,要想让国内用户用上该模型,开发者还需对其进行微调...
-
融汇14个AI工具构建完美应用
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 上篇:融汇11款AI工具构建完美应用 如您所见,人工智能(AI)应用在近年来得到了长足的发展。从语音助手到软件开发,人工智能已在我们...
-
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是...
-
谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别
近年来,在线文本识别模型取得了显著进展,但数学表达(ME)识别作为更为复杂的任务仍未得到足够关注。 谷歌研究团队推出了 MathWriting,一个专注于在线手写数学表达的数据集,包含230k 人工编写和400k 合成样本,超越了类似 IM2LATEX-1...
-
CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Towards Realistic Scene Generation with LiDAR Diffusion Models 论文链接:https://hancyran.github.io/a...
-
比较三种优秀 AI 编码工具
GitHub Copilot、Amazon CodeWhisperer 和 Tabnine 是人工智能编码助手新时代的领先选择,优点包括提高开发人员效率和代码质量。 与任何新技术一样,将人工智能编码工具引入开发流程也有缺点。人工智能编码工具目前在代码许...
-
曾秒售罄口袋AI设备Rabbit R1竟是一场骗局?设备源代码首次曝光
美国初创公司rabbit.tech推出的口袋 AI 设备 Rabbit R1曾一度引起轰动,声称该设备能够代替用户执行任务,让用户远离应用程序的束缚。Rabbit首批1万台竟在短短一天内就被抢购一空,其售价为199美元 不过,有开发者在github曝光,...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。 在模型生成错误回复内容时,如果能够「深入理解其背后运行机制」,或许可以解决模型的幻觉问题。 然而,随着深度神经网络...
-
新测试基准发布,最强开源Llama 3尴尬了
如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。 大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。...
-
五个免费使用ChatGPT API的开源项目
今天给大家介绍Github上5个比较火的免费获取GPT key的项目,希望大家能用到。真正来讲并不是GPT key,而是转发key和转发api接口,但是不管什么原理,最终只要可以实现AI问答的效果,就算完美。我们不讲过程,只要结果。以上都是白嫖的信息差果...
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图像,可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常,这些对应关系是二维到二维的...
-
融汇11款AI工具构建完美应用
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 如您所见,人工智能(AI)应用在近年来得到了长足的发展。从语音助手到软件开发,人工智能已在我们的生活中无处不在,并得到了广泛应用。下面...
-
四款值得推荐的AI辅助编程工具
在这个AI迅速发展的阶段,涌现出了一大批好用的AI辅助编程工具。AI辅助编程工具能够提高开发效率、改善代码质量、降低bug率,是现代软件开发过程中的重要助手。今天大姚给大家分享4款AI辅助编程工具(并且都支持C#语言),希望对大家有所帮助。 http...
-
清华系发布全新金融AI功夫量化 几秒完成金融数据分析
近日,国内AI创新企业功夫源科技推出了一款名为「功夫量化」的金融数据分析AI应用,标志着金融数据分析领域的一次重大突破。 「功夫量化」AI应用能够在PB级金融数据中以秒级速度进行精准的信息搜寻,为普通投资者提供了一款无需编程即可轻松进行数据分析的金融工具。...
-
五种搭建LLM服务的方法和代码示例
在不断发展的大型语言模型(LLMs)领域中,用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中,我们将总结5种搭建开源大语言模型服务的方法,每种都附带详细的操作步骤,以及各自的优缺点。 1、Anaconda + CPU 我们首先介...
-
Linux之父讽刺AI炒作:很搞笑,大概我也会被大模型取代
几天前,由 Linux 基金会主办的北美开源峰会(Open Source Summit North America)在华盛顿西雅图闭幕。 会上,Linux 之父 Linus Torvalds 与其好友、Verizon 开源项目办公室负责人 Dirk Ho...
-
清华叉院教授扔出量子密码学重磅炸弹!论文引业界轰动,但算法被发现bug
一直以来,解决格上的近似最短向量问题(Lattice Problems)以及带错误学习问题(LWE),都是计算机领域的经典算法难题。 尤其是在科学界看来,它们远远超出了传统计算机的能力范围。 那么,量子计算机有望能破解Lattice Problems以及...
-
4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源
蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。 西湖大学的研究人员利用Fo...
-
这款Linux发行版发起AI禁令!生成代码质量堪忧!阿里也被大模型幻觉愚弄了!网友:人比生产力更重要!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) Gentoo Linux是一套通用的、快捷的、完全免费的Linux发行版,因出色的包管理系统Portage而被开发人员广为喜爱。最近,GentooLinux社区宣布:发行版将不再允...
-
五个简单好用的本地运行大模型的方法
出品 | 51CTO技术栈(微信号:blog51cto) 像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用,但可能并不总是希望的问题或敏感数据由外部应用程序处理。在平台上尤其如此,在这些平台上,你的互动可能会被人类审查,并以其他方...