模型性能第8页 - AIGC资讯

逆天了！UniVision：BEV检测和Occupancy联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-01-22 人工智能

877阅读

网络安全人士必知的AI专业术语

随着人工智能的迅猛发展，我们正置身于第四次工业革命的浪潮中。在这个数字化的时代，网络安全成为各行业至关重要的议题。作为网络安全从业人员，不仅需要熟练掌握传统安全领域的知识，更需要深刻理解和运用人工智能，以在风云变幻的网络战场中保护信息资产。人工智能不仅为...

大数据 2024-01-22 人工智能

1283阅读

ChatGPT 和文心一言两大AI助手的比较

一背景 ChatGPT是由OpenAI开发的，它可以理解自己生成的内容，并根据输入的上下文进行推理和生成回复。这种自我理解的能力使得ChatGPT在处理复杂对话和问题时具有优势。然而，ChatGPT的缺点是只能根据预先设定的规则和模板回...

大数据 2024-01-22 人工智能

2360阅读

AIGC内容分享(四十一)：国内AIGC独角兽冲出几家？

目录 2023年新晋AI独角兽智谱AI：清华计算机系KEG科研成果百川智能：原搜狗CEO王小川创业项目零一万物：李开复筹建的新项目 Minimax：前商汤副总裁创业项目结尾： 2023年新晋AI独角兽根据IT桔子数据，截...

生成式AI 2024-01-21 人工智能

896阅读

大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

大模型领域中，微调是改进模型性能的重要一步。随着开源大模型逐渐变多，人们总结出了很多种微调方式，其中一些取得了很好的效果。最近，来自 Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，给人带来了一点新的震撼。在新方法中，作者...

人工智能 2024-01-21 人工智能

831阅读

被OpenAI、Mistral AI带火的MoE是怎么回事？一文贯通专家混合架构部署

选自 HuggingFace 博客编译:赵阳专家混合（MoE）是 LLM 中常用的一种技术，旨在提高其效率和准确性。这种方法的工作原理是将复杂的任务划分为更小、更易于管理的子任务，每个子任务都由专门的迷你模型或「专家」处理。早些时候，有人爆料...

生成式AI 2024-01-21 人工智能

1799阅读

AI视野：百度推视频生成模型UniVG；下一代大模型Llama3正在训练；腾讯推视频模型VideoCrafter2；TikTok测试AI作曲功能

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ???AI应用 1、百度推出视频生...

人工智能 2024-01-19 人工智能

905阅读

苹果AIM自回归视觉模型验证性能与模型规模有关

苹果公司的研究者通过自回归图像模型（AIM）验证了视觉模型“参数越多性能越强”的规律，进一步证明随着容量或预训练数据量的增加，模型能不断提升性能。AIM能有效利用大量未经整理的图像数据，训练方法和稳定性与最近的大型语言模型(LLM 类似。这一观察结果与之前...

人工智能 2024-01-18 人工智能

832阅读

ConvNet与Transformer谁更强？Meta评测4个领先视觉模型，LeCun转赞

如何根据特定需求选择视觉模型？ ConvNet/ViT、supervised/CLIP模型，在ImageNet之外的指标上如何相互比较？来自MABZUAI和Meta的研究人员发表的最新研究，在「非标准」指标上全面比较了常见的视觉模型。论文地址：ht...

生成式AI 2024-01-18 人工智能

836阅读

大模型“藏毒”：“后门”触发，猝不及防！

撰稿 | 言征出品 | 51CTO技术栈（微信号：blog51cto）跟大模型会产生幻觉相比，更可怕的事情来了，最新的一项研究证明：在用户不知情的情况下，最初觉得很得力的大模型助手，将化身“间谍”，产生破坏性代码。具体来讲，一组研究人员对LL...

人工智能 2024-01-17 人工智能

832阅读

ReSimAD：如何在没有真实数据的情况下，提升感知模型的泛化性能

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解自动驾驶车辆传感器层面的域变化是很普遍的现象，例如在不同场景和位置的自动驾驶车辆，处在不同光照、天气条件下的自动驾驶车辆，搭载了不同传感器设备的自动驾驶车辆，上述这些...

大数据 2024-01-17 人工智能

929阅读

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。...

生成式AI 2024-01-16 人工智能

856阅读

元象开源大模型XVERSE-Long-256K 支持输入25万汉字

元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K，支持输入25万汉字，无条件免费商用。该模型填补了开源生态空白，与元象之前的大模型组成了高性能全家桶。XVERSE-Long-256K 在评测中表现出色，超越了其他...

大数据 2024-01-16 人工智能

1028阅读

OpenAI Whisper论文笔记

OpenAI Whisper论文笔记 OpenAI 收集了 68 万小时的有标签的语音数据，通过多任务、多语言的方式训练了一个 seq2seq （语音到文本）的 Transformer 模型，自动语音识别（ASR）能力达到商用水准。本文为李沐老师论文精...

人工智能 2024-01-15 人工智能

932阅读

深挖RLHF潜力，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

继第一份大模型对齐技术报告（Secrets of RLHF in Large Language Models Part I）获 NeurIPS 2023 workshop best paper 后，第二份报告强势归来，复旦语言和视觉团队联合推出的第二...

大数据 2024-01-15 人工智能

882阅读

【LLM】微调LLM：LoRA 还是全参数？Llama 2 的深入分析

?大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流? ?个人主页－Sonhhxg_柒的博客_CSDN博客 ? ?欢迎各位→点赞? + 收藏⭐️ + 留言? ?系列专栏 - 机器学习【ML】自然语言...

人工智能 2024-01-15 人工智能

1890阅读

AI视野：阿里推ReplaceAnything框架；OpenAI取消军用禁令；Pika推视频画面扩充功能；SD推图生视频插件I2V-Adapter

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ?‍???聚焦开发者阿里推Rep...

大数据 2024-01-15 人工智能

837阅读

LLM AutoEval:AI平台自动评估Google Colab中的LLM

在自然语言处理领域，语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型（LLMs）评估过程的工具，专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1....

人工智能 2024-01-15 人工智能

879阅读

Stable Diffusion XL（SDXL）核心基础知识

文章目录一、Stable Diffusion XL基本概念二、SDXL模型架构上的优化（一）SDXL的整体架构（二）VAE （三）U-Net （四）text encoder （五）refiner model 三、SDXL在训练上的技...

人工智能 2024-01-15 人工智能

2331阅读

向量数据库：AIGC时代的必备基础工具

今天分享的AIGC系列深度研究报告：《向量数据库：AIGC时代的必备基础工具》。（报告出品方：广发证券）报告共计：47页点击添加图片描述（最多60个字）编辑一、向量数据库为 AI 大模型全生命周期管理提质增效随着AI大模型的...

AIGC 2024-01-15 人工智能

866阅读

当AI变成“守法公民”，为何用户反而不爱它了

ChatGPT、OpenAI这两个名字无疑是2023年科技圈最为炙手可热的存在，但投入AI大模型赛道的显然远远不止OpenAI一家，例如谷歌有Gemini、Meta有开源的Llama2、亚马逊也有Titan。并且这个赛道目前来看也并非巨头们的狂欢，比如创业...

大数据 2024-01-15 人工智能

845阅读

实战AI大模型：AIGC及经典模型

今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的...

大数据 2024-01-14 人工智能

1188阅读

大语言模型漏洞缓解指南

虽然大语言模型(LLM 应用正在全球快速普及，但企业对大语言模型的威胁态势仍然缺乏全面了解。面对大语言模型风险的不确定性，企业希望在保障其安全性的基础上加快应用脚步，用人工智能提升企业核心竞争力，这意味着企业的CISO面临着理解和应对新兴人工智能威胁...

大数据 2024-01-13 人工智能

916阅读

新研究：医用AI评估精神分裂新患者治疗效果近乎盲猜

1月12日消息，一项最新研究发现，用于协助医生治疗精神分裂症患者的计算机算法不能很好适应之前开发过程中未见过的新鲜数据。因此这种医用人工智能在评估未曾接触过的患者的治疗效果时，表现十分糟糕。这些医用工具利用人工智能来发现大数据集中的特征，并预测个体对...

AIGC 2024-01-13 人工智能

726阅读

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

969阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

894阅读

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议、使用方法、案例应用(计算能力/代码能力/看图能力等之详细攻略解读：在2022年11月横空出世的ChatGPT，打遍天下无敌手的时候，就知道会有这么一天，...

AIGC 2024-01-07 人工智能

866阅读

20分钟，使用Amazon SageMaker快速搭建属于自己的AIGC应用

真火！作为最近一段时间人工智能领域内的顶流之一，AIGC（AI-Generated Content）早已火爆出圈，频登各大互联网平台热搜。 cite: 微软亚洲研究院官方微博这段时间以来，基于深度学习的内容生成在图像、视频、语音、音乐、...

大数据 2024-01-07 人工智能

806阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1109阅读

一个评测模型+10个问题，摸清盘古、通义千问、文心一言、ChatGPT的“家底”！...

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业毫无疑问，全球已经在进行大模型的军备竞赛了，“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问，今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言...

生成式AI 2024-01-06 人工智能

945阅读

图解tinyBERT模型——BERT模型压缩精华

译者 | 朱先忠审校 | 重楼简介近年来，大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一，可以高精度地解决各种自然语言处理（NLP）任务。继BERT模型之后，一组其他的模型也先后出现并各自展示出优秀的性能。不难看到一个明显趋势...

AIGC 2024-01-05 人工智能

1032阅读

端到端的自动驾驶会取代Apollo、autoware这类框架吗？

本文经自动驾驶之心公众号授权转载，转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位：百度作者：共一 Jian...

人工智能 2024-01-04 人工智能

901阅读

突破Pytorch核心点，CNN ！！！

哈喽，我是小壮！创建卷积神经网络（CNN），很多初学者不太熟悉，今儿咱们来大概说说，给一个完整的案例进行说明。 CNN 用于图像分类、目标检测、图像生成等任务。它的关键思想是通过卷积层和池化层来自动提取图像的特征，并通过全连接层进行分类。原理 1.卷...

大数据 2024-01-03 人工智能

781阅读

从新手到专家，两天全面掌握GitHub Copilot

随着大型AI模型性能的爆炸式提升，AI辅助编程工具真正从根本上改变了开发者的生产力，并对开发工作整个生命周期产生了深远的影响，这种影响不仅仅体现在开发编码效率的提升，更体现在对团队产研工作流程、开发思路、编码方式的重塑上。而在众多AI辅助编程工具中，微软G...

AIGC 2024-01-02 人工智能

1080阅读

谷歌Gemini大逆转？斯坦福Meta华人证明其推理性能强于GPT-3.5

【新智元导读】谷歌放出的Gemini，在对标GPT的道路上似乎一直处于劣势，Gemini真的比GPT-4弱吗?最近，斯坦福和Meta的学者发文为Gemini正名。 Gemini的推理能力，真的比GPT-4弱吗? 此前，谷歌憋出的重磅复仇神器Gemini P...

生成式AI 2024-01-02 人工智能

894阅读

Hyena成下一代Transformer？StripedHyena-7B开源：最高128k输入，训练速度提升50%

最近几年发布的AI模型，如语言、视觉、音频、生物等各种领域的大模型都离不开Transformer架构，但其核心模块「注意力机制」的计算复杂度与「输入序列长度」呈二次方增长趋势，这一特性严重限制了Transformer在长序列下的应用，例如无法一次性处理一...

人工智能 2024-01-02 人工智能

1079阅读

【网安AIGC专题10.19】论文4：大模型（CODEX 、CodeGen 、INCODER ）+自动生成代码评估：改进自动化测试方法、创建测试输入生成器、探索新的评估数据集扩充方法

Is Your Code Generated by ChatGPT Really Correct? 写在最前面主要贡献这篇论文的创新点，为之后的论文提供了一些的启发未来研究的方向：改进自动化测试方法、创建测试输入生成器、探索新的评估数...

大数据 2024-01-01 人工智能

968阅读

神经网络中的分位数回归和分位数损失

在使用机器学习构建预测模型时，我们不只是想知道“预测值(点预测 ”，而是想知道“预测值落在某个范围内的可能性有多大(区间预测 ”。例如当需要进行需求预测时，如果只储备最可能的需求预测量，那么缺货的概率非常的大。但是如果库存处于预测的第95个百分位数(需求...

AIGC 2024-01-01 人工智能

835阅读

LLaMA, ChatGLM, BLOOM的参数高效微调实践

作者：回旋托马斯x（腾讯NLP算法工程师）项目地址：https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比大语言模型的训练分为两个阶段：（1）在海量文本语料上的无监督预训练，学习通用的语义表...

人工智能 2024-01-01 人工智能

1279阅读

九大Pytorch最重要操作！！

今儿咱们聊聊pytorch的事情，今儿总结了九个最重要的pytorch的操作，一定会给你一个总体的概念。张量创建和基本操作 PyTorch的张量类似于NumPy数组，但它们提供了GPU加速和自动求导的功能。张量的创建可以通过torch.tensor，...

生成式AI 2023-12-31 人工智能

821阅读

SOLAR10.7B大模型屠榜HuggingFace 创新性拼接两个羊驼，高效集成

深度学习领域的新技术近日在HuggingFace的大模型排行榜中崭露头角，由Upstage AI提出的深度扩展方法（DUS）在SOLAR10.7B大模型上取得了令人瞩目的成绩。该技术通过创新性地拼接两个7B羊驼，并采用DUS方法删除中间层次，使得新模型不仅...

人工智能 2023-12-29 人工智能

858阅读

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模...

人工智能 2023-12-29 人工智能

1052阅读

AI视野：Midjourney开始训练视频模型；文心一言用户破亿；优酷上线“AI搜片”功能；快手开源KwaiAgents系统

???AI新鲜事 Midjourney开始训练视频模型 Midjourney昨晚发布了重要消息，将开始视频模型训练，同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步，提高内容连贯性和提示准确性。重点改进包括Inpainting功能和全新...

大数据 2023-12-28 人工智能

1014阅读

微软推大模型整合性工具库PromptBench

微软最近推出了一个专门用于评估大语言模型的整合性工具库，名为PromptBench。该工具库提供了一系列工具，包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等，以支持研究人员从不同方面对LLMs进行评估和分析。项目地址:https:/...

AIGC 2023-12-27 人工智能

863阅读

一文读懂分类模型评估指标

模型评估是深度学习和机器学习中非常重要的一部分，用于衡量模型的性能和效果。本文将逐步分解混淆矩阵，准确性，精度，召回率和F1分数。混淆矩阵混淆矩阵是在分类问题中用于评估模型性能的表格，它展示了模型对样本的分类情况。混淆矩阵的行表示实际类别，列表示预...

AIGC 2023-12-27 人工智能

878阅读

2024 年数据管理在人工智能中的四大趋势

在 2023 年即将结束之际，我们会发现随着 ChatGPT 的引入，世界发生了不可逆转的变化。人工智能的主流化继续以强劲势头推进，我们如何应对这些不断变化的时代需要信念的飞跃。人工智能可能同时具有潜在的变革性和不准确性！但我们的未来不仅仅是人工智能，因...

生成式AI 2023-12-27 人工智能

878阅读

得物大模型平台，业务效果提升实践

一、背景得物大模型训练与推理平台上线几个月后，我们与公司内部超过 10 个业务领域展开了全面的合作。在一些关键业务指标方面，取得了显著的成效，例如：效率相关部门的合作，多维度打标总正确率取得 2 倍以上提升。利用大模型开辟了新的业务，提升了效...

大数据 2023-12-27 人工智能

819阅读

阿里云赵大川：弹性计算推理解决方案拯救 AIGC 算力危机

云布道师本篇文章围绕弹性计算推理解决方案 DeepGPU 实例如何支持 Stable Diffusion 文生图推理、Stable Diffusion 推理演示示例等相关话题展开。赵大川阿里云弹性计算高级技术专家 GPU 云服务器推理解决方案...

大数据 2023-12-26 人工智能

880阅读

机器学习模型性能的十个指标

尽管大模型非常强大，但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比，解释现实中的物理现象，未必要用到量子力学。有些相对简单的问题，或许一个统计分布就足够了。对机器学习而言，也不用言必深度学习与神经网络，关键在于明确问题的边界。那么在...

AIGC 2023-12-25 人工智能

878阅读

Point Transformer V3：更简单、更快、更强!

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Point Transformer V3: Simpler, Faster, Stronger 论文链接：https://arxiv.org/pdf/2312.10035.pdf 代码链接：h...

生成式AI 2023-12-25 人工智能

1091阅读