-
AIGC 原理与代码实例讲解
AIGC 原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 随着人工智能技术的快速发展,生成式AI成为了科技界的一大热点。在众多生成技术中,AIGC(Artificial Intelligence for Generation and Crea...
-
AI绘画工具SD的安装
目录 Stable Diffusion软件包的官方下载地址是什么? 如何确保设备满足Stable Diffusion的硬件与软件要求? 硬件要求 软件要求 Stable Diffusion安装过程中常见的问题及其解决方案有哪些? 如何选择适...
-
深度解读昇腾CANN模型下沉技术,提升模型调度性能
本文分享自华为云社区《深度解读昇腾CANN模型下沉技术,提升模型调度性能》,作者:昇腾CANN。 AI模型的运行通常情况下需要CPU和NPU(昇腾AI处理器)等AI专用处理器协同工作,CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(De...
-
文心一言用户达3亿!文心大模型4.0 Turbo发布,支持API,真GPT-4 Turbo国产来了!
文心一言用户规模达到3亿了! 这是笔者在今天的百度Wave Summit 2024大会上的看到的数字。需要强调的是,文心一言的用户规模是在去年12月破亿的。这意味着,仅仅隔了6个月,文心一言用户数量在亿这个级别的数字上竟然直接翻了三倍。 近几年,大家常...
-
文心一言发展历史
文心一言(英文名:ERNIE Bot)的发展历史可以清晰地分为几个阶段,以下将结合参考文章中的相关数字和信息,以分点表示和归纳的形式呈现: 一、早期研发历程 ERNIE 1.0的发布: 时间:2019年3月16日 内容:百度正式发布知识增强...
-
文心大模型4.0加持的文心一言工具保姆级使用教程!快点赞收藏起来!
现在科技圈什么最火?那一定是大模型了。 如雨后春笋般冒出的大模型,每一个都在争做行业No.1,但你知道现在哪个大模型能力最强?哪个最受人喜欢吗? 近日,清华大学发布《SuperBench大模型综合能力评测报告》,从五大方面评测 14 个海内外具有代表性...
-
尝到AI甜头 Meta重组Reality Labs
Reality Labs的持续亏损让Meta的元宇宙之路走得比SpaceX “登火星”还难,大刀阔斧的改革还在继续。 近日,Meta宣布对负责元宇宙和虚拟现实业务的Reality Labs重大重组,将其拆分为“元宇宙”和“可穿戴设备”业务两个部门。未来的规...
-
Stable Diffusion本地部署全攻略:从概念到实战
目录 一、概念篇:什么是Stable Diffusion? 二、原理篇:Stable Diffusion是如何工作的? 三、作用篇:Stable Diffusion能为我们带来什么? 四、教程篇:如何在本地部署Stable Diffusion?...
-
一文实现Llama 3 图片理解能力微调(XTuner+LLaVA 版)
本次实验基于 Llama3-8B-Instruct 和 XTuner 团队预训练好的 Image Projector 微调自己的多模态图文理解模型 LLaVA。实验平台为InternStudio,实验所用的显存为24G。 =============目录=...
-
Stable Diffusion 详细教程
Stable Diffusion是一个概念上类似于Diffusion Models的技术,特别是在生成图像和处理自然语言任务方面。然而,“Stable Diffusion”并不是一个直接对应的具体项目或库名称,如DDPM(Denoising Diffusi...
-
面向AIGC的InfiniBand网络技术特性分析
在AIGC的训练场景,基本上不差钱的客户都会首选InfiniBand,作为跨AI服务器节点的网络组网方案,今天我们就来讲一讲InfiniBand到底有那些针对AIGC场景的技术优化: &nbs...
-
研究人员使用机器学习优化高功率激光实验
高强度和高重复的激光器能快速连续每秒发射多次强大的光。商业聚变能源工厂和先进的紧凑型辐射源都依赖这种激光系统。然而,人类的反应时间不足以管理这种速射系统,应用面临挑战。 为了应对这一挑战,科学家们正在寻找不同的方法来利用自动化和人工智能的力量,这些技术...
-
浅说文心一言
文心一言(ERNIE Bot)是一个基于Transformer结构的知识增强大语言模型,它可以根据用户的指令和输入,生成相应的回答或文本。以下是一些常见的指令示例,你可以根据需要进行调整: 问答指令: "请问什么是文心一言?" "文心一言和C...
-
AI在咳嗽中检出癌症,不信?世卫组织正全球推广
中国的AI技术,登上联合国了! AI for Good峰会是联合国在AI领域的旗舰峰会,今年,联合国秘书长古特雷斯、“深度学习三巨头”之一的Hinton,以及OpenAI CEO奥特曼等都来参会了。 这样一场盛会中,一位中国女性患者吹奏口琴的视频吸引了全...
-
【优质书籍推荐】AIGC时代的PyTorch 深度学习与企业级项目实战
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
这些AI芯片创企想挑战英伟达,它们能成功吗?
科幻小说《沙丘》中有这样一句话:“谁控制了GPU,谁就控制了宇宙。”在今天的科技世界,如果哪家企业想在AI领域有所见树,就要购买英伟达GPU。 分析师们喋喋不休,将追逐AI梦想的企业分成两类,也就是“GPU-rich”和“GPU-poor”,前者拥有大...
-
苹果将用自研模型Ajax优化iOS 18 不会推出类ChatGPT聊天机器人
苹果公司正致力于通过其自研的大语言模型Ajax来革新和增强iOS18的用户体验。 Ajax模型于2023年7月首次亮相,它基于Google的Jax机器学习框架构建,并在Google Cloud上运行,展现出了与OpenAI的ChatGPT、微软的Bing、...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
探秘Python神器:eli5模块如何解读机器学习模型的预测结果?
在Python编程领域,有时候我们会遇到一些复杂的代码或者算法,很难理解其中的逻辑和原理。 为了帮助我们更好地理解代码背后的运行机制,eli5模块应运而生。eli5模块是一个Python库,可以解释机器学习模型的预测结果,帮助我们理解模型是如何做出决策的...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
用户画像算法:历史、现状与未来
一、用户画像简介 画像是一种人类可理解的、机器可读写的,对用户的结构化描述。它不仅可以提供个性化服务,还在企业的战略决策和商业分析中发挥了重要作用。 1. 画像的分类 画像可以根据数据来源分为社会通识类和领域知识类。社会通识类画像又可以按照时间维度划分成...
-
标题:探索AI绘画:使用深度学习生成艺术
正文: 随着计算机技术的发展,人工智能在各个领域取得了显著的成果。 通过训练深度学习模型,AI可以学习大量的艺术作品,从而生成具有独特风格和创意的新作品。 本文将介绍如何使用Python和TensorFlow实现一个简单的AI绘画程序。...
-
GitHub突破1000星!上交、清华开源个性化联邦学习算法库PFLlib
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 我们在 GitHub 上开源了一个个性化联邦学习算法仓库(PFLlib),目前已经获得 1K+ 个 Star 和 200+ 个 Fork...
-
无需服务器!浏览器上直接运行近 700 个 AI 模型!
本文阿宝哥将介绍 Github 上一个超强的开源项目 —— transformers.js[1]。有了它,你可以直接在浏览器中运行 Transformers,无需服务器! 利用它提供的超能力,你可以在浏览器上直接运行不同的 AI 模型,实现很多非常有用的...
-
JS 的 AI 时代来了!
JS-Torch 简介 JS-Torch[1] 是一个从零开始构建的深度学习 JavaScript 库,其语法与 PyTorch[2] 非常接近。它包含一个功能齐全的张量对象(可跟踪梯度)、深度学习层和函数,以及一个自动微分引擎。 图片 PyTorch...
-
AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
AssemblyAI 最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。先说结果,Universal-1比Whisper Large-v3更准确,比fast Whisper更快,38秒...
-
Paper Digest | GPT-RE:基于大语言模型针对关系抽取的上下文学习
笔记整理:张廉臣,东南大学硕士,研究方向为自然语言处理、信息抽取 链接:https://arxiv.org/pdf/2305.02105.pdf 持...
-
恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
此前,人形机器人Ameca「大梦初醒」的神情,已让许多人感受到了真正的「恐惧」。 随着ChatGPT横空出世,得到加持的人形机器人虽擅长语言交流,但是在非语言交流,特别是面部表情,还差得很远。 未来,如果人类真的要生活在一个充满机器人的世界之中,机器...
-
开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练
开源人工智能平台Lightning AI宣布与Nvidia合作,发布了名为“Thunder”的下一代AI编译器,旨在加速人工智能模型的训练速度。据Lightning AI称,该编译器在实际场景中相比未优化的代码,可将大型语言模型(LLMs)的训练速度提高高...
-
Stable Diffusion生成式扩散模型代码实现原理
Stable Diffusion可以使用PyTorch或TensorFlow等深度学习框架来实现。这些框架提供了一系列的工具和函数,使得开发者可以更方便地构建、训练和部署深度学习模型。因此可以使用PyTorch或TensorFlow来实现Stable Di...
-
消息称高通、谷歌、英特尔等联合开发 AI 软件:让代码不挑硬件,打破英伟达统治格局
3 月 26 日消息,英伟达凭借 AI 芯片的领先,如今已成为行业巨无霸,包括微软等巨头也需要与其合作,全球超过 400 万开发者依靠英伟达的 CUDA 软件平台来构建 AI 和其他应用。 据路透社报道,为了打破这一局面,包括高通、谷歌和英特尔在内的科...
-
英伟达推出6G研究云平台,致力于实现6G RAN雄伟目标
在凭借RAN加速器进军移动网络领域之后,英伟达希望依托芯片和AI技术,能够在6G领域发挥更大、更关键的作用。 在日前举办的2024年度GTC AI大会上,英伟达宣布推出新的6G研究云平台(6G Research Cloud Platform 。这是一种...
-
马斯克突然开源Grok:3140亿参数巨无霸,免费可商用
马斯克说到做到: 旗下大模型Grok现已开源! 代码和模型权重已上线GitHub。官方信息显示,此次开源的Grok-1是一个3140亿参数的混合专家模型—— 就是说,这是当前开源模型中参数量最大的一个。 消息一出,Grok-1的GitHub仓库已揽获4...
-
如何本地部署Stable Diffusion:详细步骤与指南
Stable Diffusion作为一种前沿的深度学习图像生成技术,在艺术创作、设计、科学可视化等领域展现出巨大的潜力。若您希望在自己的本地环境中部署Stable Diffusion,以下是一份详细的步骤与指南,帮助您成功搭建并运行该模型。 一、准备环境...
-
破茧而出:从困惑到爆发的AI写作之旅
大家好,小发猫降重今天来聊聊破茧而出:从困惑到爆发的AI写作之旅,希望能给大家提供一点参考。 以下是针对论文重复率高的情况,提供一些修改建议和技巧,可以借助此类工具: 标题:破茧而出:从困惑到爆发的AI写作之旅 在数字时代的浪潮中,AI写作逐渐成...
-
Mac专属大模型框架来了!两行代码部署,能聊本地数据,还支持中文
Mac用户,终于不用羡慕N卡玩家有专属大模型Chat with RTX了! 大神推出的新框架,让苹果电脑也跑起了本地大模型,而且只要两行代码就能完成部署。 仿照Chat with RTX,框架的名字就叫Chat with MLX(MLX是苹果机器学习框...
-
白宫发文,呼吁开发者放弃C、C++:Rust被「钦点」内存安全
近日,在一份 19 页的报告《回归基础构件:通往安全软件之路》中,白宫国家网络主任办公室(ONCD)呼吁开发者使用「内存安全的编程语言」,比如 Rust 语言。报告指出,从一开始就选择内存安全的编程语言,是以安全设计方式开发软件的重要途径。 此外,ONC...
-
与人类贴身热舞!人形机器人进阶到街头耍宝,6华人组团出品
注意看,小帅一个转身,卫衣帽子里面居然 空 无 一 头: 好啦,这不是惊悚恐怖片,而是来自UCSD(加州大学圣地亚哥分校)全华人团队的最新研究成果。 他们提出一种特别的全身控制策略(ExBody),能对人形机器人进行全身控制。策略主要训练人形机器人上半...
-
好书推荐丨AI绘画全面精通:软件平台+脚本文案+设计制作+案例实战
文章目录 写在前面 AI绘画 推荐图书 图书简介 本书特色 作者简介 推荐理由 粉丝福利 写在后面 写在前面 本期博主给大家带来了一本全新出版的AI绘画类书籍,《AI绘画全面精通:软件平台+脚本文案+设计制作+案例实战》,对人...
-
技术精英求职必备:AIGC(图像生成)研发工程师简历指南
核心原则 撰写针对AIGC(图像生成 研发工程师职位的简历时,关键在于准确展现您在深度学习、计算机视觉和图像生成算法方面的综合技能、项目经验和技术成就。简历应作为您展示跨多个技术栈的编程能力、构建完整的图像生成解决方案和有效解决AIGC技术问题的能力的窗...
-
网络安全人士必知的AI框架
一、AI框架的重要性 AI框架是人工智能的操作系统,是基础软件,是算法和应用的根基。AI江湖传言:得框架者得天下,可见AI框架的重要性,它通过框架性思维整合了人工智能的三驾马车(算法、算力、数据 ,如果想成为头部AI企业,AI框架就是其中一项核心竞争力...
-
大模型最快推理芯片一夜易主:每秒500tokens干翻GPU!谷歌TPU人马打造,喊话奥特曼:你们也太慢了
太快了太快了。 一夜间,大模型生成已经没什么延迟了……来感受下这速度。 ,时长00:06 眼花缭乱了吧,生成速度已经接近每秒500 tokens。 还有更直观的列表对比,速度最高能比以往这些云平台厂商快个18倍吧。 (这里面还有个熟悉的身影:Lepton...
-
Groq大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达
Groq公司推出的大模型推理芯片以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU。该芯片由初创公司Groq研发,其团队成员来自谷歌TPU,包括创始人兼CEO Jonathan Ross,曾设计实现第一代TPU芯片的核心元件。 Groq采...
-
图像生成与修复:AI绘画的新时代
1.背景介绍 图像生成与修复是一种非常重要的计算机视觉任务,它可以帮助我们创建新的图像,并修复损坏或不完整的图像。随着人工智能技术的发展,图像生成与修复的能力也在不断提高,使得AI绘画成为了一个热门的研究领域。 在本文中,我们将讨论图像生成与...
-
如何使用AIGC进行图像生成和编辑
1.背景介绍 图像生成和编辑是计算机视觉领域的重要应用,随着人工智能技术的发展,AIGC(Artificial Intelligence Generative Convolutional 已经成为了图像生成和编辑的主流方法。在本文中,我们将详细介...
-
AIGC:人工智能生成技术的新兴领域
1.背景介绍 1. 背景介绍 人工智能生成技术(AIGC 是一种利用机器学习和自然语言处理等技术来自动生成自然语言文本或其他形式的内容的技术。这种技术在近年来取得了显著的进展,为各种应用场景提供了强大的支持。本文将从背景、核心概念、算法原理、...
-
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必...
-
了解AIGC在图像识别和生成中的应用
1.背景介绍 在过去的几年里,人工智能(AI 已经成为了我们生活中的一部分,它在图像识别和生成方面的应用也非常广泛。在这篇文章中,我们将探讨一下AI生成式图像识别(AIGC 在图像识别和生成中的应用,以及其背后的核心概念和算法原理。 1. 背...
-
文心一言 使用指南
文心一言快速入门指南,只要3步 第一步:不要“学”,直接拿来用 刚开始一个月,尽量让自己每天玩10次文心一言。把自己工作、生活中遇到的问题,随手记录下来,扔给文心一言,看看它有什么建议。大约大半个月后,会逐渐发现文心一言的迷人之处。这个时候...
-
实际案例:AIGC在艺术创作中的作用
1.背景介绍 1. 背景介绍 随着人工智能技术的不断发展,AI生成模型已经成为艺术创作的一种重要手段。在这篇文章中,我们将探讨AIGC(AI-Generated Content 在艺术创作中的作用,并分析其在艺术领域的应用前景。 2. 核...