模型训练第9页 - AIGC资讯

对标GPT-4！中国移动九天大模型通过双备案

快科技4月4日消息，日前，国家网信办公布已备案大模型清单，中国移动九天自然语言交互大模型”名列其中，标志着中国移动九天AI大模型可正式对外提供生成式人工智能服务。中国移动表示，这是同时通过国家生成式人工智能服务备案”和境内深度合成服务算法备案”双备案的首...

人工智能 2024-04-04 人工智能

866阅读

Stable Diffusion WebUI 1.8.0来了

上周 Stable Diffusion WebUI 发布了 1.8.0 版本，更新内容比较多，据说显存使用有了大幅的下降，这几天我也找时间把 AutoDL 镜像的版本做了个升级，有兴趣的同学可以去体验下新版本了。这里分享下其中几个我认为比较重要的更新。...

生成式AI 2024-04-03 人工智能

911阅读

AI绘图：Stable Diffusion WEB UI 详细操作介绍：基础篇

接上一篇《AI绘图体验：Stable Diffusion本地化部署详细步骤》本地部署完了SD后，大家肯定想知道怎么用，接下来补一篇Stable Diffusion WEB UI 详细操作，如果大家还没有完成SD的部署，请参考上一篇文章进行本地化的部署。...

人工智能 2024-04-03 人工智能

938阅读

OpenAI 宣布用户无需注册账号即可使用 ChatGPT，但有部分限制

IT之家 4 月 2 日消息，OpenAI 宣布将降低其 AI 聊天机器人 ChatGPT 的使用门槛，即使没有账号的用户也能使用，不过会有一定限制。从即日起，部分地区的用户访问 chat.openai.com 将不再需要登录即可直接与 ChatGP...

大数据 2024-04-02 人工智能

782阅读

好书推荐《AIGC重塑金融》

作者：林建明来源：IT 阅读排行榜本文摘编自《AIGC 重塑金融：AI 大模型驱动的金融变革与实践》，机械工业出版社出版这是最好的时代，也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力，但其应用也面临不容忽视的风险和挑战。本文将深入研...

人工智能 2024-04-02 人工智能

826阅读

文心一言杀疯了！大模型社区、插件系统来了，码农神器发布，AI原生时代降临

夕小瑶科技说原创作者 | 卖萌酱文心一言的这波更新，是真的杀疯了。笔者测试了刚刚更新的文心一言，发现效果相比上一版又有了一个质的飞跃，内容创作、推理、代码等诸多维度的能力都有了肉眼可见的效果提升。更加王炸的是，文心一言领先国内一众竞品，...

大数据 2024-04-02 人工智能

946阅读

深度学习：AIGC重塑金融大模型驱动金融变革

作者：林建明来源：IT阅读排行榜本文摘编自《AIGC重塑金融：AI大模型驱动的金融变革与实践》，机械工业出版社出版这是最好的时代，也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力，但其应用也面临不容忽视的风险和挑战。本文将深入研究大模型...

生成式AI 2024-04-02 人工智能

842阅读

LLaMA 模型中的Transformer架构变化

目录 1. 前置层归一化（Pre-normalization） 2. RMSNorm 归一化函数 3. SwiGLU 激活函数 4. 旋转位置嵌入（RoPE） 5. 注意力机制优化 6. Group Query Attention 7. 模型...

AIGC 2024-04-02 人工智能

1225阅读

集体出走的Stability AI 发布全新代码大模型，3B以下性能最优，超越Code Llama和DeepSeek-Coder

Stability AI又有新动作！程序员又有危机了？ 3月26日，Stability AI推出了先进的代码语言模型Stable Code Instruct 3B，该模型是在Stable Code 3B的基础上进行指令调优的Code LM。 Stab...

AIGC 2024-04-02 人工智能

930阅读

【没有哪个港口是永远的停留~论文解读】stable diffusion 总结代码&推导&网络结构

了解整个流程：【第一部分】输入图像 x （W*H*3的RGB图像）【第一部分】x 经过编码器生成 (latent 空间的表示 h*w*c (具体设置多少有实验【第二部分】逐步加噪得到，和噪声标签【第二部分】由 Unet（）...

大数据 2024-04-01 人工智能

1244阅读

采用生成式人工智能系统可能会改变企业的云架构

从数据可用性和安全性到大型语言模型和选择和监控，企业采用生成式人工智能意味着需要重新审视自己的云架构。所以，很多企业正在重新构建云架构，同时也在开发生成式人工智能系统。那么，这些企业需要做些什么改变?新兴的最佳实践是什么?行业专家表示，在过去的20年...

生成式AI 2024-04-01 人工智能

763阅读

【粉丝福利社】《AIGC重塑金融：AI大模型驱动的金融变革与实践》（文末送书-进行中）

? 作者简介，愚公搬代码 ?《头衔》：华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，51CTO博客专家等。 ?《近期荣...

人工智能 2024-04-01 人工智能

801阅读

GPT-5史诗级更新之前，OpenAI的“新东西”来了，曝定价百万字符15美元，语音克隆引擎让老外说“有口音的”中文

撰稿 | 伊风出品 | 51CTO技术栈（微信号：blog51cto） OpenAI的新动作来了！此前Altman在采访中透露，在GPT-5史诗级的升级发布之前，OpenAI将在未来几个月发布许多“很酷的新东西”。今天，OpenAI语音引擎首次亮...

人工智能 2024-04-01 人工智能

818阅读

【AIGC】大模型在金融行业的应用场景和落地路径

这是最好的时代，也是最坏的时代。尽管大模型技术在金融领域具有巨大的应用潜力，但其应用也面临不容忽视的风险和挑战。本文将深入研究大模型在金融领域的数据隐私和安全风险、模型可解释性和透明度、监管和合规要求，梳理中国、美国、欧洲等地 AIGC 技术的应用规则，...

AIGC 2024-03-31 人工智能

1136阅读

Stable Diffusion之核心基础知识和网络结构解析

Stable Diffusion核心基础知识和网络结构解析一. Stable Diffusion核心基础知识 1.1 Stable Diffusion模型工作流程 1. 文生图(txt2img 2. 图生图 3. 图像优化模块 1.2...

生成式AI 2024-03-31 人工智能

1322阅读

AIGC重塑金融：AI大模型驱动的金融变革与实践

?个人主页: Aileen_0v0?热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ?个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-tVrfBkGvUD0Qi13F {font-family:"trebuchet...

生成式AI 2024-03-31 人工智能

856阅读

AIGC重塑金融 | 大模型在金融行业的应用场景和落地路径

作者：林建明来源：IT阅读排行榜本文摘编自《AIGC重塑金融：AI大模型驱动的金融变革与实践》，机械工业出版社出版目录 01 大模型在金融领域的 5 个典型应用场景 02 大模型在金融领域应用所面临的风险及其防范 03 AIGC 技术的科...

人工智能 2024-03-31 人工智能

975阅读

LLaMA-Factory参数的解答

打开LLaMA-Factory的web页面会有一堆参数，但不知道怎么选，选哪个，这个文章详细解读一下，每个参数到底是什么含义这是个人写的参数解读，我并非该领域的人如果那个大佬看到有参数不对请反馈一下，或者有补充的也可以！谢谢（后续该文章可能会持续更新）...

大数据 2024-03-30 人工智能

1260阅读

基于stable diffusion的IP海报生成

【AIGC】只要10秒，AI生成IP海报，解放双手！！！在AIGC市场发展的趋势下，如何帮助设计工作者解放双手。本文将从图像生成方向切入，帮助大家体系化的学习Stable diffusion的使用，完成自有IP的训练以及生成，主要从部署、训练、生成3大核心...

AIGC 2024-03-30 人工智能

1259阅读

AI写作查出来高风险怎么办：七大应对策略

大家好，小发猫降ai今天来聊聊AI写作查出来高风险怎么办：七大应对策略，希望能给大家提供一点参考。降ai辅写以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI写作查出来高风险怎么办：七大应对策略随...

生成式AI 2024-03-29 人工智能

1585阅读

今日AI：OpenAI要给开发者发钱；马斯克Grok-1.5王炸级更新；李玟姐姐称AI“复活”是二次伤害；世界首个Mamba的生产级模型Jamba发布

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI新鲜事 OpenAI将推...

人工智能 2024-03-29 人工智能

991阅读

全面对标GPT4 Turbo！科大讯飞刘聪：6月发布星火大模型V4.0版本

快科技3月27日消息，科大讯飞副总裁、研究院院长刘聪在博鳌2024年会现场表示：科大讯飞计划在今年6月，正式发布对标GPT-4（Turbo）当前能力的星火大模型V4.0版本。” 刘聪还透露，讯飞星火大模型V4.0目前正在训练中。讯飞星火大模型从去年5月6...

生成式AI 2024-03-28 人工智能

752阅读

llama factory学习笔记

模型模型名模型大小默认模块 Template Baichuan2 7B/13B W_pack baichuan2 BLOOM 560M/1.1B/1.7B/3B/7.1B/176B query_key_value - BLOOM...

大数据 2024-03-28 人工智能

1223阅读

【在线回放】NVIDIA GTC 2024 大会 | 如何降低 AI 工程成本？蚂蚁从训练到推理的全栈实践

本文内容来源于蚂蚁集团 AI Infra部门负责人张科，在 GTC 2024 大会 China AI Day 线上专场的演讲。在演讲中张科分享了 AI 工程当前的现状和主要挑战，以及蚂蚁集团在 AI 工程领域的实践经验和开源项目，也欢迎 AI 工程领域的同...

AIGC 2024-03-27 人工智能

975阅读

近屿智能成功完成A轮融资，打造独家AIGC工程师与产品经理学习路径图引发热议

近屿智能OJAC的发展历程与行业实力在2024年1月，上海近屿智能科技有限公司（简称近屿智能）宣布成功完成A轮融资。智望资本作为领头投资者，金沙江创投也参与了增资。这一里程碑事件不仅突显了近屿智能在人力资源技术领域的领先地位，也显示了投资者对其技术实力...

AIGC 2024-03-27 人工智能

942阅读

CLIP-BEVFormer：显式监督BEVFormer结构，提升长尾检测性能

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解目前，在整个自动驾驶系统当中，感知模块扮演了其中至关重要的角色，行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后，才能让自动驾驶系统中的下游规控模块做...

大数据 2024-03-26 人工智能

1217阅读

AI模型训练：强化算法与进化算法

强化学习算法(RL 和进化算法(EA 都属于机器学习领域的子集，但它们在解决问题的方法和思想上有所不同。强化学习算法：强化是一种机器学习范式，它主要关注的是智能体(agent 在与环境进行交互的过程中，通过尝试和错误来学习最优的行为策略，以使其在某...

AIGC 2024-03-25 人工智能

809阅读

大数据 AI 一体化解读

一、AI 的“iPhone”时刻在过去的一年中，大模型的发展非常迅速，算力和数据的堆叠使模型具备了一些通用的构造和回答问题的能力，引领人们进入了一直梦想的人工智能阶段。举个例子，在与大语言模型聊天时，会感觉面对的不是一个生硬的机器人，而是一个有血有肉的...

生成式AI 2024-03-25 人工智能

959阅读

llama factory 参数体系EvaluationArguments、DataArguments、FinetuningArguments、FreezeArguments、LoraArgument

项目地址 https://github.com/hiyouga/LLaMA-Factory 模型层参数这段代码是使用Python的dataclasses模块定义的一个数据类ModelArguments，用于管理和存储与模型微调相关的参数。这个类的设计是...

人工智能 2024-03-25 人工智能

1823阅读

昇思MindSpore 2.3全新发布 | 昇思人工智能框架峰会2024圆满举办

北京时间3月22日消息，人工智能框架作为软件根技术，已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇，思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办，旨在汇聚AI产业界创新力量，推动根技术持续创新，共建人...

AIGC 2024-03-22 人工智能

789阅读

为什么说GPU再火，AI平台也少不了强力的CPU

AIGC的这把火，燃起来的可不只是百模大战的热度和雨后春笋般的各式AI应用。更是由于算力与通信需求的爆发式增长，使得底层的专用加速芯片、以及配备这些芯片的AI加速服务器再次被拉到了大众的聚光灯下。据统计，2023年全球范围内的AI服务器市场规模已经达到...

大数据 2024-03-22 人工智能

900阅读

AIGC狂飙对于普通人意味着什么？

AIGC 人工智能生成内容，相对更早的内容生产模式分别为专家生产内容 PGC 和用户生产内容 UGC。而随着 AIGC 出现，内容生产率变成指数级上升。那么AIGC发展对于普通人来说到底意味着什么? 先回顾一下时间轴， 2015年7月，谷歌推出 De...

AIGC 2024-03-21 人工智能

972阅读

Stable Diffusion 3 震撼发布，采用Sora同源技术，文字终于不乱码了

Stable Diffusion 3 和 Sora 一样采用了 diffusion transformer 架构。继 OpenAI 的 Sora 连续一周霸屏后，昨晚，生成式 AI 顶级技术公司 Stability AI 也放了一个大招 ——Sta...

人工智能 2024-03-20 人工智能

946阅读

亚马逊云科技与英伟达扩展合作加速超万亿参数级大模型训练

亚马逊云科技与英伟达扩展合作，加速生成式 AI 创新。双方将在亚马逊云科技上提供 NVIDIA Blackwell 架构 GPU，包括 GB200Grace Blackwell 超级芯片和 B100Tensor Core GPU，以帮助客户解锁新的生成式...

大数据 2024-03-20 人工智能

815阅读

降低AIGC总体疑似率的七大策略

随着人工智能技术的飞速发展，AIGC（人工智能生成内容）的应用越来越广泛。然而，随之而来的问题是AIGC的疑似率居高不下，这给人们带来了不少困惑和疑虑。为了解决这个问题，本文将探讨降低AIGC总体疑似率的七大策略。提高数据质量数据是训练人工智能模...

大数据 2024-03-20 人工智能

1175阅读

近屿智能成功获得A轮资金，其首创的AIGC工程师与产品经理学习路径图引起业界广泛关注。

2024年1月，上海近屿智能科技有限公司（简称近屿智能）宣布其A轮融资圆满成功，智望资本作为领投方，金沙江创投也进行了追加投资。这一轮融资的成功，标志着近屿智能在AIGC技术领域的领先地位获得了业界的广泛认可，并反映了投资者对其技术实力和未来增长潜力的充分...

生成式AI 2024-03-20 人工智能

938阅读

如何扩展大模型的上下文长度

一、背景大模型的上下文长度是指我们在使用大模型的时候，给大模型的输入加上输出的字符（Token）总数，这个数字会被限制，如果超过这个长度的字符会被大模型丢弃。目前开源的大模型上下文长度一般不长，比如 Llama 2 只有 4K，Code-Llama 系...

生成式AI 2024-03-19 人工智能

1116阅读

NVIDIA大语言模型落地的全流程解析

包括三部分内容：第一部分是关于 NeMo Framework。NeMo Framework 是 NVIDIA 大语言模型的全栈解决方案，它通过不同组件完成生成式 AI 各个环节的任务，包括数据预处理、分布式训练、模型微调、模型推理加速及部署（Ten...

生成式AI 2024-03-18 人工智能

915阅读

智能邮件防护：ML.NET 3.0助力垃圾邮件过滤，让你告别烦扰

概述：ML.NET3.0等机器学习工具，我们可以利用这一数据集训练模型，实现自动分类邮件为垃圾或正常，提高电子邮件过滤效果。 ML.NET是Microsoft推出的开源机器学习框架，可用于在.NET应用程序中集成机器学习功能。ML.NET提供了基础用法...

人工智能 2024-03-18 人工智能

942阅读

自适应剪枝让多模态大模型加速2-3倍，哈工大等推出SmartTrim

基于 Transformer 结构的视觉语言大模型（VLM）在各种下游的视觉语言任务上取得了巨大成功，但由于其较长的输入序列和较多的参数，导致其相应的计算开销地提升，阻碍了在实际环境中进一步部署。为了追求更为高效的推理速度，前人提出了一些针对 VLM 的...

大数据 2024-03-18 人工智能

869阅读

AI写作的深度探索：困惑度、爆发度与内容质量的角力

大家好，小发猫降重今天来聊聊AI写作的深度探索：困惑度、爆发度与内容质量的角力，希望能给大家提供一点参考。以下是针对论文重复率高的情况，提供一些修改建议和技巧，可以借助此类工具： AI写作的深度探索：困惑度、爆发度与内容质量的角力在当今的数字...

人工智能 2024-03-15 人工智能

845阅读

全球最快AI芯片WSE-3发布性能碾压H100！

最新发布的全球最强AI芯片WSE-3引起了行业的瞩目。该芯片采用了先进的4万亿晶体管5nm制程，拥有惊人的性能，单机可训练出24万亿参数的模型，远超英伟达H100GPU。 WSE-3的技术优势在于其90万个AI核心和44GB片上SRAM存储，使其峰值性能达...

AIGC 2024-03-15 人工智能

810阅读

4万亿晶体管5nm制程，全球最快AI芯片碾压H100！单机可训24万亿参数LLM，Llama 70B一天搞定

全球最快、最强的AI芯片面世，让整个行业瞬间惊掉了下巴！就在刚刚，AI芯片初创公司Cerebras重磅发布了「第三代晶圆级引擎」（WSE-3）。性能上，WSE-3是上一代WSE-2的两倍，且功耗依旧保持不变。 90万个AI核心，44GB的片上SRA...

生成式AI 2024-03-15 人工智能

837阅读

超强！深度学习Top10算法！

自2006年深度学习概念被提出以来，20年快过去了，深度学习作为人工智能领域的一场革命，已经催生了许多具有影响力的算法。那么，你所认为深度学习的top10算法有哪些呢？以下是花哥我心目中的深度学习top10算法，它们在创新性、应用价值和影响力方面都具...

生成式AI 2024-03-14 人工智能

890阅读

房价预测模型代码笔记以及文心一言Q.A记录

导入库方面略过不提第一部分：简易日期处理模块 def processdate(date : date_num = (int(date[:4] - 2014 *12 + (int(date[4:6] -5 return date_n...

AIGC 2024-03-13 人工智能

881阅读

如何使用Nightshade保护艺术品免受生成式AI的侵害

译者 | 陈峻审校 | 重楼如您所见，当前正在发生的这场人工智能（AI）革命已经席卷了各行各业。其中给人最直观的感受便是，在基于交互式人机对话的基础上，AI算法不但可以生成类似人类语言的文本，而且能够根据一个（组）单词创建图像和视频。不过，这些人工智...

人工智能 2024-03-13 人工智能

781阅读

蚂蚁金服异常检测和归因诊断分析实践

一、归因诊断在实际工作中，我们常常受到业务方对关键绩效指标（KPI）的灵魂拷问：某个 KPI 指标为什么会上升或下降？归因诊断的任务就是解释这些指标变化的原因。归因诊断把问题的定位过程看作是一个因子对比的过程：指标在基准时间区间的值为 y，...

AIGC 2024-03-13 人工智能

1079阅读

扩散模型如何构建新一代决策智能体？超越自回归，同时生成长序列规划轨迹

设想一下，当你站在房间内，准备向门口走去，你是通过自回归的方式逐步规划路径吗？实际上，你的路径是一次性整体生成的。近期的研究表明，采用扩散模型的规划模块能够同时生成长序列的轨迹规划，这更加符合人类的决策模式。此外，扩散模型在策略表征和数据合成方面也能为...

人工智能 2024-03-11 人工智能

880阅读

近屿智能完成A轮融资，打造行业领先的AIGC工程师与产品经理成长蓝图

2024年1月，上海近屿智能科技有限公司（简称近屿智能）成功完成了A轮融资，智望资本担任了领投角色，而金沙江创投也进行了追加投资。这一融资里程碑充分证明了近屿智能在AIGC行业的技术领先地位得到了市场的广泛认可和投资人的青睐。自创立伊始，近屿智能始...

大数据 2024-03-09 人工智能

1095阅读

云知声旗下蓝藻AI服务升级推出 AI 声音克隆等功能

云知声 AIGC 内容创作平台蓝藻 AI 近日进行全新升级，重点关注 AI 声音克隆和 AI 配音两大核心功能。声音克隆是蓝藻 AI 的核心功能之一，用户可以通过声音克隆在线复刻自己的声音，快速、简单、低成本地创建个性化音频。只需提供少量用户原始录音，就...

大数据 2024-03-08 人工智能

860阅读