-
人均6万美元:2024英伟达奖学金名单公布,五位华人入选
本周五,备受期待的英伟达奖学金公布了入选者名单。 二十多年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近 200 名学生提供了 600...
-
大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2
增加LLM上下文长度可以提升大语言模型在一些任务上的表现,这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。 对长上下文场景,在解码阶段,缓存先前token的Key和Value(K...
-
还在担心发抖音没素材跟文案?[腾讯云HAI] AIGC带你蹭热度“今年你失去了什么?”
目录 ?前言: ?了解高性能应用服务 HAI ?即插即用 · 轻松上手 ?横向对比 · 青出于蓝 ?应用场景-AI作画 ?应用场景-AI对话 ?应用场景-算法研发 ?使用HAI进行AI作画 ?基于 ChatGLM2-6B 创作个人专属的知...
-
Gemini官网体验入口 谷歌最新AI模型软件app免费下载地址
《Gemini》是Google最新推出的一款先进的大型人工智能模型。这款AI模型被设计成多模态,能够理解和操作不同类型的信息,包括文本、代码、音频、图像和视频。那么,《Gemini》在哪里可以体验呢?下面就给大家带来《Gemini》官网体验入口和免费app...
-
RangePerception:Range View3D检测新思路!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:RangePerception: Taming LiDAR Range View for Efficient and Accurate 3D Object Detection 论文链接:htt...
-
Meta、微软表示将购买 AMD 的最新 AI 芯片 MI300X,作为英伟达芯片的替代品
在 AMD 周三的投资者活动上,最新的人工智能芯片——Instinct MI300X">Meta、OpenAI 和微软宣布,他们将使用 AMD 最新的人工智能芯片——Instinct MI300X。这是迄今为止科技公司寻找替代 Nvidia 昂贵图形...
-
盘点AWS re:Invent 2023大会值得关注的十大亮点
译者 | 晶颜 审校 | 重楼 “AWS re:Invent 2023”于11月27日至12月1日在拉斯维加斯举行,展示了亚马逊保持其领先云提供商地位的承诺。通过一系列战略公告,该公司展示了其在行业中树立新标准的不懈追求。以下是今年活动的十大亮点: A...
-
Meta、微软承诺购买AMD新型人工智能芯片 作为英伟达GPU替代品
12月7日消息,当地时间周三Meta、OpenAI和微软在AMD投资者活动上表示,他们都将使用AMD最新开发的人工智能芯片Instinct MI300X。这表明,虽然英伟达的GPU芯片对于开发和部署ChatGPT等人工智能程序至关重要,但很多科技公司都...
-
云上使用 Stable Diffusion ,模型数据如何共享和存储
随着人工智能技术的爆发,内容生成式人工智能(AIGC)成为了当下热门领域。除了 ChatGPT 之外,文本生成图像技术更令人惊艳。 Stable Diffusion,是一款开源的深度学习模型。与 Midjourney 提供的直接将文本转化为图像的服务不同...
-
面向AI开发的六种最重要的编程语言
作者丨FATIH KÜÇÜKKARAKURT 译者 | 布加迪 审校 | 重楼 出品 | 51CTO技术栈(微信号:blog51cto) 在AI开发界,你使用的编程语言很重要。每种语言有其独特的特性。选择合适的语言不是关乎个人偏好的...
-
Rain AI vs NVIDIA:奥特曼执掌的OpenAI想改变AI芯片游戏规则?
摆脱昂贵的NVIDIA芯片已经成为AI公司的梦想,就连大名鼎鼎的OpenAI也不例外。OpenAI 董事会开除山姆·奥特曼(Sam Altman)事件爆发不久后,就有消息传出奥特曼曾与许多投资者洽谈,打算募资成立一家新的AI 芯片公司。 如今这件事也有...
-
马斯克的人工智能初创公司 xAI 正在寻求高达 10 亿美元的投资
X.AI,一家由埃隆·马斯克创立的人工智能初创公司,已向美国证券交易委员会(SEC)提交文件,计划通过一次股权发行筹集高达 10 亿美元。 根据文件,该公司已经从四名投资者那里筹集了近 1.35 亿美元,首次出售发生在 11 月 29 日,并且已经有「具...
-
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑战者,引起大量关注: Mamba(曼巴,一种蛇),在语...
-
客户案例:高性能、大规模、高可靠的AIGC承载网络
客户是一家AIGC领域的公司,他们通过构建一套完整的内容生产系统,革新内容创作过程,让用户以更低成本完成内容创作。 客户网络需求汇总 RoCE的计算网络 RoCE存储网络 1.不少于600端口200G以太网接入端口,未来可扩容至至少128...
-
首批搭载酷睿Ultra处理器!联想小新Pro AI超能本2024官宣
快科技12月4日消息,今天,联想小新官方宣布,小新Pro AI超能本2024将首批搭载全新酷睿Ultra处理器,并号称要挑战酷睿Ultra轻薄平台最强性能”。 从官方发布的海报来看,该款笔记本将会搭载16英寸屏幕,提供有数字键盘,不过官方并未公布确切发布...
-
在本地使用CPU运行Llama 2模型来实现文档Q&A
第三方商业大型语言模型(LLM)提供商,如OpenAI的GPT4,通过简单的API调用使LLM的使用更加容易。然而,由于数据隐私和合规等各种原因,我们可能仍需要在企业内部部署或私有模型推理。 开源LLM的普及让我们私有化部署大语言模型称为可能,从而减少了...
-
【腾讯云 HAI域探秘】借助高性能应用HAI——我也能使用【stable diffusion】制作高级视频封面了
目录 高性能应用服务HAI_GPU云服务器的申请与服务创建 官网地址:高性能应用服务HAI_GPU云服务器_腾讯云 通过高性能应用服务HAI——创建【stable diffusion】 WebUI效果: 服务器后台效果: stable-diff...
-
黄仁勋预测:5年内或能实现AGI!全力满足中国需求,美国距「供应链独立」还有10年
最近,在《纽约时报》的年度DealBook峰会上,黄仁勋表示,如果把通用人工智能(AGI)定义为能以「相当有竞争力」的方式完成人类智能测试的计算机,那么在未来五年内,我们将看到AGI。 英伟达的业务之所以蓬勃发展,是因为对高性能图形处理器(GPU)的需求...
-
今日思考(1) — 算力对机器人的影响(基于文心一言的回答)
目录 1.高tops的算力能支持什么水平的复合机器人控制 2.什么情况下控制机器人需要更高的算力 3.为什么使用人工智能算法,例如深度学习、强化学习等,需要更多的计算资源来实现更精准的决策和控制。 4.将已经训练好的人工智能算法模型,例...
-
通义千问720亿参数模型开源,率先实现“全尺寸全模态”开源
12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。 在英语任务上,Qwen-72B在MMLU基准测...
-
使用PyTorch加速生成式 AI模型
PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT, Fast》的博文,重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。 正如最近在PyTorch 开发者大会上...
-
亚马逊的 Trainium2 AI 芯片配备 96GB HBM,训练性能提高四倍
本周,亚马逊网络服务(AWS)推出了其新的人工智能(AI)加速器芯片 Trainium2,相比其前身,它显著提升了性能,使 AWS 能够训练具有高达数万亿参数的基础模型(FMs)和大型语言模型(LLMs)。此外,AWS 还为自己设定了一个宏伟目标,即使其客...
-
构建大规模数据存储解决方案:探索MongoDB的横向扩展
MongoDB是一个非常适合构建大规模数据存储解决方案的NoSQL数据库。它通过横向扩展的方式来应对不断增长的数据量和负载需求。下面将详细介绍MongoDB的横向扩展机制,并探索如何使用MongoDB来构建高性能、可伸缩的大规模数据存储解决方案。 横向扩...
-
使用Accelerate库在多GPU上进行LLM推理
大型语言模型(llm 已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。 所以本文将在多个gpu上并行执行推理,主要包括:Accelerate库介绍,简单的方法与工...
-
联手英伟达、ChatGPT 最强竞品 Claude,亚马逊云科技开启生成式 AI 大决战
2000年,亚马逊带着“网络就是计算机”疑惑,懵懂地叩开了云计算的大门,在其电子商务网站初尝试后,成功推出 S3(Simple Storage Service)和 EC2(Elastic Cloud Computer 产品,自此高歌猛进,将云计算正式带入大...
-
黄仁勋:AI将在五年内赶超人类 ,OpenAI首台AI超算是马斯克买的
11月30日消息,英伟达首席执行官黄仁勋周三在《纽约时报》的年度DealBook峰会上表示,人工智能正在超越人类。 他指出,如果通用人工智能(AGI)被定义为一种计算机,能够以与人类智能相媲美的方式完成测试,那么“在接下来的五年里,显然,人工智能可以完...
-
笔记本外接显卡坞死机/键盘鼠标卡死问题的解决
我的笔记本尝试ai绘画当然是不行的,所以用雷电3显卡坞外接显卡使用。但是使用雷电3显卡坞后,经常性的死机。玩游戏的时候不会,表明外接显卡在工作时就不会导致死机。 你可以先借鉴下面的简单方法1:解决外接显卡扩展坞鼠标键盘卡死的问题 - 知乎 或方法2:用...
-
AWS与NVIDIA扩大合作,提供先进的生成式AI基础设施
Amazon Web Services(AWS)和NVIDIA(英伟达)宣布扩大合作,致力于为生成式人工智能(AI 创新提供先进的基础设施、软件和服务。该合作旨在为客户提供训练基础模型和构建生成式AI应用所需的关键技术。根据周二(11月28日 的新闻稿,A...
-
加速人工智能任务,同时保护数据安全
麻省理工学院的研究人员开发了一种搜索引擎 SecureLoop,可以有效地识别深度神经网络加速器的最佳设计,在提高性能的同时保护数据安全。 随着计算密集型机器学习应用程序(例如执行实时语言翻译的聊天机器人)的激增,设备制造商通常会采用专门的硬件组件来...
-
【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍!
Llama 2 发布! Meta 刚刚发布了 LLaMa 2,它是 LLaMA 的下一代版本,具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸:7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构,并且是...
-
解密Java连接MySQL的最佳实践:选择适合你的方式
连接MySQL是Java开发中非常常见的任务之一。下面将为您介绍连接MySQL的最佳实践,并提供一些适用于不同情况的方法选择。 Java连接MySQL的方式有多种,下面我们将逐个介绍这些方式,并讨论它们的优劣和适用场景。 1、使用JDBC驱动程序连接My...
-
当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍
目录 模型生成效果展示(prompt 全公开) 如何注册 Stable Diffusion 使用 SD(dreamstudio.ai )的收费标注如何 SD 提供哪些参数可以设置 如何使用种子来改进一张作品 我用 SD 创作的图片著作权如何归属...
-
Llama-Factory的baichuan2微调
Llama-Factory:https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。 默认模块应作...
-
stable diffusion 安装教程
stable diffusion安装教程 环境准备 硬件要求 安装软件 Python 安装 安装git 安装cuda工具 安装工具包 模型下载 生成图片 成果展示 环境准备 硬件要求 1.需要拥有NVIDIA显卡...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
Redis内存空间预估与内存优化策略:保障数据安全与性能的架构实践AIGC/AI绘画/chatGPT/SD/MJ
推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接 玩转cloud Studio 在线编码神器 玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间 资源分享 「java、pytho...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 S...
-
GPT成熟之路官方笔记 | OpenAI开发者日
ChatGPT产品打造的细节,现在OpenAI自己交了个底。 并且这波干货分享真是信息量满满,包括但不限于: ChatGPT背后的产品和研发团队如何协作 大模型应用如何从原型走向成熟 OpenAI如何优化大模型性能…… 以上信息,依然来自今年的新晋...
-
比「让我们一步一步思考」这句咒语还管用,提示工程正在被改进
大型语言模型(LLM)已经是许多自然语言处理任务的强大工具,只要能给出正确的提示。然而,由于模型的敏感性,找到最优提示通常需要进行大量手动尝试和试错努力。此外,一旦将初始提示部署到生产环境中,可能会出现意想不到的边缘情况,需要更多轮的手动调整来进一步完善...
-
浅谈人工智能中的算力、算法和数据
Labs 导读 随着科技的飞速发展,人工智能(Artificial Intelligence,AI)已经成为当今最热门的话题之一。在人工智能的应用中,算力、算法和数据是三个不可或缺的要素,也是生成式人工智能(AIGC)发展的核心。通过对人工智能中算...
-
深度解读AIGC存储解决方案
5月26日,2023数据基础设施技术峰会在苏州举办,腾讯云首席存储技术专家温涛受邀出席并分享了腾讯云领先的存储技术在AIGC场景中的应用,通过对AIGC业务流程和场景的提炼,从内容生成、内容审核和内容智理三要素介绍了如何智能的存储和管理数据。下面我们一起回...
-
今日思考(2) — 训练机器学习模型用GPU还是NUP更有优势(基于文心一言的回答)
前言 深度学习用GPU,强化学习用NPU。 1.训练深度学习模型,强化学习模型用NPU还是GPU更有优势 在训练深度学习模型时,GPU相比NPU有优势。GPU拥有更高的访存速度和更高的浮点运算能力,因此更适合深度学...
-
【网安AIGC专题11.1】11 Coreset-C 主动学习:特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)
Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面 论文名片 先验知识的补充 主动学习 采样函数 benchmark基准和base...
-
AIGC数据处理与存储解决方案
针对在AIGC的场景下,如何解决在AIGC训练过程中数据的存储和数据处理的问题,杨冠军从三个方面进行介绍与解读: 一是AIGC对存储提的新需求; 二是介绍腾讯云可以给用户提供的整体存储解决方案; ...
-
Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利
在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一人工智能(AI)程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并保持和LLaMA社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的...
-
腾讯披露最新大模型训练方法,可节省50%算力成本
在算力紧缺的背景下,如何提升大模型训练和推理的效率,并降低成本,成为业界关注的焦点。 11月23日,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级,大模型训练效率提升至主流开源框架的2.6倍,千亿级大模型训练可节省50%算力成本。升级后...
-
OpenAI,请重新思考 Retrieval Assistant 的方案
作者:栾小凡 Zilliz 合伙人、技术总监 近期, OpenAI 在首届开发者大会上公布了系列最新进展,引发各大媒体和从业人员的广泛关注。 其中最引人注目的是全新推出的 GPT-4 Turbo ——一个更经济、更高效的服务版本,可以显著提升用户体验。...