-
基于分层自监督学习将视觉Transformer扩展到千兆像素图像
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 Vision Transformers (ViT 及其多尺度和分层变体已成功地捕获图像表示,但它们的使用通常被研究用于低分辨率图像(例如256×256、384×384)。 1 概括 对于计算病...
-
AI日报:效果炸裂!Krea Video向所有人开放;阿里花8亿入股Kimi;Arc Search可以打电话了;腾讯智影声音大模型升级
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Krea AI视频生成工具向所...
-
通用世界模型问世:不学习就能生成新领域视频,可实时控制
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。 世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,一直以来被认为是通往通用人工智能(AGI)的关键路径之一,与当前大模型推崇的智能...
-
搜狐资讯自动爬虫:智能时代的信息收集利器
随着互联网的迅猛发展,海量信息涌现在我们的视野中。在这个信息爆炸的时代,如何高效、准确地获取所需资讯,成为了摆在每个人面前的重要课题。而“搜狐资讯自动爬虫”作为一种强大的信息收集工具,正以其智能化、高效化的特点,引领着信息获取方式的革新。首先,我们来了解一...
-
抓住AIGC行业的未来:现在正是进入的最佳时机
目录 引言 一、AIGC行业前景 1、技术成熟与应用普及 1.1深度学习 1.2自然语言处理 1.3生成对抗网络 2、商业机会与创新平台 2.1内容创作 2.2个性化推荐 3、未来展望与个人发展 3.1技术人员的发展机会 3.2非技...
-
Stable Diffusion AI绘画
我们今天来了解一下最近很火的SD模型 ✨在人工智能领域,生成模型一直是研究的热点之一。随着深度学习技术的飞速发展,一种名为Stable Diffusion的新型生成模型引起了广泛关注。Stable Diffusion是一种基于概率的生成模型,它可以学...
-
探索Llama 3模型在地理行业的应用
Llama 3模型简介 Llama 3模型是基于最新的神经网络架构设计而成,它融合了Transformer和图像注意力机制,能够同时处理自然语言和图像输入,实现跨模态信息的融合和理解。这使得Llama 3模型在地理信息处理和分析方面有着独特的优势...
-
为什么并非所有的企业都该拥抱AIGC?
原始撰稿 从大的趋势上来看,肯定是所有的企业都要拥抱大模型或者是拥抱AI的。但是目前从我们对于很多大模型的测评结果与第三方视角来看,大部分企业的核心业务、生产流程还是不太能够依赖大模型的,现在还是属于在相对边缘的业务上做一些尝试,可能成本的下降不是直接...
-
前沿科技应用:AIGC技术的广泛渗透
✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ ?? 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。? 希望在这里,我们能一起探索IT世界的奥妙,提升我们的...
-
自回归模型的优缺点及改进方向
在学术界和人工智能产业中,关于自回归模型的演进与应用一直是一个引发深入讨论和多方观点交锋的热门议题。尤其是Yann LeCun,这位享誉全球的AI领域学者、图灵奖的获得者,以及被誉为人工智能领域的三大巨擘之一,他对于自回归模型持有独特的批判视角。值得注意...
-
漫画小说源码带爬虫的探索之旅
在当今数字化时代,漫画与小说已成为许多人休闲娱乐的首选。随着互联网的普及,大量的漫画与小说资源涌现于网络,但同时也伴随着版权、整理与检索等方面的问题。此时,漫画小说源码带爬虫应运而生,它不仅可以帮助我们高效地搜集整理这些资源,还能够为漫画小说平台的搭建提供...
-
“问答爬虫”技术揭秘:智能信息检索的未来
在互联网时代,信息获取已经成为人们日常生活中不可或缺的一部分。随着互联网技术的不断发展和数据量的急剧增长,如何高效、准确地从海量信息中筛选出有价值的信息,成为了亟待解决的问题。在这样的背景下,“问答爬虫”技术应运而生,它凭借其智能化、精准化的特点,正在逐步...
-
微软发布Phi-3 Vision等最新大模型系列
微软发布了其最新的大型语言模型系列,Phi-3,包括Phi-3Vision、Phi-3Small7B和Phi-3Medium14B型号。这些模型在性能上与当前领先的大型模型相媲美,同时在特定领域提供了一些独特的优势。 Phi-3Medium14B 型号的...
-
大模型数据标注平台Scale AI融资10亿美元,估值达138亿美元
日前,大模型领域著名数据标注平台 Scale AI 宣布完成10亿美元的 F 轮融资,公司估值达138亿美元,成为该领域独角兽。 此轮融资由 Accel 领投,亚马逊、英特尔、AMD、思科、Meta、ServiceNow、老虎全球基金等全球知名公司跟投。...
-
拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」
【新智元导读】近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。 辛辛苦苦给大语言模型输入了一大堆提示,它却只记住了开头和结尾? 这个现象叫做LLM的中间迷失(...
-
百度知道爬虫:探索知识共享的技术手段
在当今信息爆炸的时代,知识获取变得前所未有的便捷与高效。互联网作为一个巨大的知识库,汇聚了来自世界各地的信息与智慧。而在这个巨大的知识宝库中,“百度知道”以其独特的问答模式,为广大网友提供了一个交流思想、分享知识的平台。为了进一步挖掘和利用这些宝贵的知识资...
-
腾讯问卷推出AI功能 已接入腾讯混元大模型
腾讯问卷宣布推出全流程 AI 解决方案,基于腾讯混元大模型,帮助企业提升调研的质量与效率。 腾讯问卷是腾讯旗下在线问卷调查平台,服务覆盖问卷调查、信息上报、在线测评等工作场景,帮助用户回收34亿份问卷。通过腾讯混元大模型的接入,腾讯问卷在问卷设计、投放、回...
-
微软发布AI工具 Recall,帮助你找到那些找不到的文件
微软全力投入 AI PC 竞赛。在 Build 大会上,微软宣布了一些令人兴奋的消息,例如推出 C o p i l o t+ PC 系列以及即将到来的 C o p i l o t的人工智能更新。该公司还宣布了 Recall AI,这是微软描述为电脑的 “照...
-
“豆瓣电影爬虫”探秘:数据背后的电影世界
随着互联网的迅猛发展,大数据时代已经来临,数据获取和分析成为我们了解世界的重要手段。电影,作为最受欢迎的文艺形式之一,豆瓣电影更是以其独到的评分系统和丰富的用户评论,成为影迷们交流与评价的聚集地。而“豆瓣电影爬虫”则是探索这一数据宝库的重要工具,今天,就让...
-
探秘艺帆企业CMS爬虫:数据抓取与智能化的先驱
在当今信息化高速发展的时代,数据已经成为企业竞争的重要资产。为了获取更多有价值的数据,众多企业纷纷投身于爬虫技术的研发与应用。在此背景下,艺帆企业凭借其强大的技术实力和创新能力,推出了一款备受瞩目的CMS爬虫,为企业数据抓取与智能化处理提供了得力助手。一、...
-
微博爬虫:探索社交网络数据的利器
随着互联网的迅猛发展,社交媒体成为了人们生活中不可或缺的一部分。作为中国最大的社交媒体平台之一,微博汇聚了数以亿计的用户,每时每刻都在产生着海量的数据。这些数据蕴含着丰富的信息,对于市场分析、舆情监测、品牌推广等领域具有极高的价值。然而,要从这浩如烟海的数...
-
易人CMS爬虫:探索数据获取与智能化信息处理的新路径
在当前数字化时代,信息是无价之宝,而网络则是信息最庞大的储存库。随着内容的爆炸式增长,如何高效、准确地抓取和分析信息,成为了众多行业所面临的关键问题。易人CMS爬虫作为一款强大的网络信息抓取工具,以其灵活性和高效性吸引了大量用户的关注。本文将对易人CMS爬...
-
又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
前言 该模型结合了 SigLIP 视觉模型和 Gemma 语言模型,这两种模型都是开放组件,使得PaliGemma在处理视觉与语言结合的任务上表现出色。 PaliGemma的使用场景包括图像字幕、图像标签和视觉问答等。这些应用场景利用了PaliGemm...
-
数据库为啥要融合+AI化?甲骨文Oracle 23ai给出了回答
2017年,一篇名为《Attention is All You Need》的论文提出了一种新的神经网络架构: Transformer。七年后,Transformer成为了生成式AI的核心,正引领着今天的技术浪潮。 在甲骨文公司副总裁及中国区董事总经理吴...
-
「大模型」之所短,「知识图谱」之所长
最近一年以来,大语言模型技术突飞猛进,被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来,给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图,其中包括了文本生成、图像生成等技术。本次分享...
-
微软让MoE长出多个头,大幅提升专家激活率
混合专家(MoE)是个好方法,支持着现在一些非常优秀的大模型,比如谷歌家的 Gemini 1.5 以及备受关注的 Mixtral 8x7B。 稀疏混合专家(SMoE)可在不显著增加训练和推理成本的前提下提升模型的能力。比如 Mixtral 8×7B 就是...
-
华为云引领首个代码大模型国际标准立项
本文分享自华为云社区《华为云引领首个代码大模型国际标准立项》,作者: 华为云头条。 近日,国际电信联盟电信标准分局第十六研究组(ITU-T SG16)于法国雷恩召开全体会议,《基于人工智能的代码生成技术要求和评估方法》国际标准项目成功获得立项通过。...
-
使用Quarkus和LangChain4j,LLM在Java中可以实现哪些功能?
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文试图通过一个有趣的原创项目,利用Quarkus和LangChain4j来揭开LLM在Java中使用的神秘面纱。 自从2022年11...
-
微调工程师岗位可能并不存在,但使用 AI 编码工具已经成为刚需
智能编码工具的快速普及是否会带来全新的编程模式?“大力出奇迹”的规律还将继续适用吗?本文节选自 QCon 北京特别策划圆桌节目,内容摘自阿里云通义灵码产品技术负责人陈鑫在圆桌对话里的精彩回答。全文见:Sora很难跟进?微调就不是一个岗位?大力出奇迹将继续适...
-
小米小爱同学与阿里云通义大模型合作 成果已在小米汽车等落地
近日,小米旗下备受欢迎的人工智能助手“小爱同学”与阿里云通义大模型携手合作,共同探索并强化在图片生成、图片理解等多模态AI生成能力的新领域。 这一创新技术已经在小米汽车、手机等多类设备上成功落地,为用户带来前所未有的智能体验。 以小米汽车SU7为例,这款车...
-
LLM 评估新纪元:Arthur Bench 全方位解读
一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一些方法,例如基于“单词出现”的评估方法,比如 BLEU,以及基于“预训练的自然语言处理模型”...
-
如何借助假设文档嵌入改进语义搜索?
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文介绍了如何使用简单的大语言模型(LLM 调用来显著改善语义搜索结果的质量。 找到合适的AI模型来构建工作流程很困难。由于不同平台上...
-
关于GenAI,要冷静
作者 | 白发川 疯狂的全民大模型 大约一年前,大家热聊的先是LLM,LLM的全称是Large language models,也就是大语言模型,那么它必然有2个特点,一个是自然语言,第二个是大。随后它带来了一个效果,就是能“生成”,可以像人一样发言...
-
当「软件研发」遇上 AI 大模型
作者:陈鑫(神秀) 大家好,我是通义灵码的产品技术负责人陈鑫。过去有八年时间,我都是在阿里集团做研发效能,即研发工具相关的工作。 我们从 2015 年开始做一站式 DevOps 平台,然后打造了云效,也就是将 DevOps 平台实现云化。到了 2023...
-
影刀AI有哪些功能免费吗?影刀AI怎么使用方法详细教程指南
影刀AI 是什么? 影刀AI是一款利用自然语言处理技术,帮助用户快速生成自动化流程和指令的智能工具。它通过对话智能生成魔法指令,解决包括数据处理、Excel、列表、图片、文本、文件、逻辑等类型的问题。影刀AI实验室还提供了AI角色,允许用户在工作中扮演不同...
-
ChatGPT会取代搜索引擎吗?
从产品交互层面,还无法取代搜索引擎,从技术角度稍微改造一下,取代传统搜索引擎是可行的。 但目前ChatGPT的交互形态,还不能取代搜索引擎。 比如ChatGPT对于不少知识类型的问题,会给出看似很有道理的答案,但有时这些答案可能是错的,但很多问题他又可以...
-
Akamai 推出业内首个 Zero Trust 平台助力企业实现更高安全性
2024年 5月8日 – 负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akamai Technologies, Inc.,以下简称:Akamai)(NASDAQ:AKAM),近日宣布其 Akamai Guardicore 平台可助力企业实现 Ze...
-
DeepSeek Chat:AI对话助手 - 使用教程与免费体验入口
DeepSeek Chat是什么? DeepSeek Chat,基于DeepSeek-V2 模型,是一款集成了 2 千亿参数量的MoE(Mixture of Experts)模型的AI技术产品。它在中文综合能力(AlignBench)和英文综合能力(MT-...
-
大模型卷爆数字人:一句话5分钟实现定制,跳舞主持带货都能hold住
最快5分钟,打造一个直接上岗工作的3D数字人。 这是大模型给数字人领域带来的最新震撼。 就像这样,一句话描述需求: 生成的数字人直接就能进驻直播间当主播。 跳起女团舞也不在话下。 整个制作过程中,想到什么说什么就行,大模型都能自动拆解需求,瞬间get...
-
零一万物发布一站式 AI 工作平台“万知”
5月7日,零一万物官宣了第一款为中国人量身一站式 AI 工作平台——万知。 万知是一款为中国人身定制的一站式 AI 工作平台,通过网页和微信小程序提供个人特助服务。 用户可以使用万知进行会议纪要周报、写作助手等工作任务,同时还可以解读财报、论文等各类文件...
-
为什么LLM在人工智能中如此受欢迎?
将大型语言模型(LLM 提升到人工智能(AI 同义词世界的中心是一项巨大的任务,它改变了描述自然语言处理(NLP 的方式。这些高度复杂的模型将其翻译成英语,使我们能够理解和生成质量可接受的文本,这是由于使用了大量数据集,并在使用的变压器网络架构等人工神...
-
微调大语言模型的七个步骤
译者 | 布加迪 审校 | 重楼 在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。 这些功能强大的模型已彻底改变了我们处理自然语言任务的方法,在翻译、情绪分析和文本自动...
-
ChatGPT们的幕后先驱,斯坦福教授Manning的四十年NLP生涯
今年 1 月份,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,斯坦福大学语言学和计算机科学教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获奖。 曼宁教授是将深度学习应用于 NLP 领域的早期领军人物,在词向量 GloVe...
-
全球开发者用GPT4都在做什么?这28种方法值得一看
出品 | 51CTO技术栈(微信号:blog51cto) 开发者们为OpenAI最新的大型语言模型GPT-4找到了许多不平凡的用途。在最近的Hacker News讨论中,开发者们分享了他们是如何使用这种大型语言模型(LLM)的。我们在此整理了一些最佳建议...
-
GitHub版Devin上线,会打字就能开发应用,微软CEO:重新定义IDE
微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了! WorkSpace是一种“Copilot原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。 也就是说,只要有想法,而且会打字,就可以...
-
小红书从记忆机制解读信息检索,提出新范式获得 EACL Oral
近日,来自小红书搜索算法团队的论文《Generative Dense Retrieval: Memory Can Be a Burden》被自然语言处理领域国际会议 EACL 2024 接收为 Oral,接受率为 11.32%(144/1271)。 他...
-
大语言模型对汽车行业的影响和实践探索
汽车行业作为技术创新的重要领域,正迅速采纳大语言模型,如 GPT 系列,以推动行业的数字化转型。这些模型在提升车载智能系统的交互体验、优化客户服务、加速产品开发及市场营销策略方面展现出巨大潜力。通过具体应用案例分析,接下来我们一起揭示大语言模型如何为汽...
-
OpenAI正在开发SearchGPT 将成Perplexity强有力的竞争对手
OpenAI 正在积极开发 Perplexity 的竞争对手——Sonic - SNC(SearchGPT),目前该工具已经进入评估阶段,并新增了多项实用功能。 域名:https://search.chatgpt.com SearchGPT 的新增功能包...
-
rabbit r1第一批买家秀来了!经历轰动与质疑后,AI硬件销冠诞生
1月9日,当rabbit inc.创始人吕骋站在摄像机前,首次向所有人举起手中那个四四方方的亮橙色迷你AI硬件时,他心里想的是:如果能卖出3千台就很高兴了。 仅仅24小时后,首批1万台r1就被预订一空。再补货,再售罄…几番回合下来,到三个月后的今天,r1销...
-
革新LLM微调之道:全方位解读PyTorch原生库torchtune的创新力量与应用价值
在人工智能领域,大语言模型(LLMs)正日益成为研究和应用的新热点。然而,如何高效、精准地对这些庞然大物进行调优,一直是业界和学术界面临的重要挑战。近期,PyTorch官方博客发布了一篇关于TorchTune的文章,引起了广泛关注。TorchTune作为...