模型性能第9页 - AIGC资讯

阿里团队推新AI模型I2VGen-XL：单张静止图像就能生成高质量视频

视频合成最近取得了显著的进步，这得益于扩散模型的快速发展。然而，它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构，使得模型难以同时确保语义和定性的卓越性。阿里巴巴、浙江大学和华中科技大学的研究人员...

AIGC 2023-12-25 人工智能

673阅读

CMU权威对比Gemini，GPT-3和Mistral8×7B！GPT-3.5依旧拿捏Gemini，开源模型差距依然不小

谷歌最近发布的Gemini掀起了不小的波澜。毕竟，大语言模型领域几乎是OpenAI的GPT一家独大的局面。不过作为吃瓜群众，当然希望科技公司都卷起来，大模型都打起来！所以，作为科技巨无霸谷歌的亲儿子，Gemini自然承受了很高的期待。虽然Gemi...

大数据 2023-12-24 人工智能

827阅读

LLaMA系列模型

1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月，Meta（原Facebook）推出了LLaMA大模型，使用了1.4...

生成式AI 2023-12-22 人工智能

785阅读

研究揭示：谷歌Gemini Pro在基准测试中落后于免费ChatGPT

根据卡内基梅隆大学的最新研究报告，谷歌最新推出的大型语言模型Gemini Pro在基准测试中未能达到预期水平，不仅落后于GPT-3.5，还远远不及GPT-4。 Gemini Pro的研究结果与谷歌在Gemini发布会上所提供的信息相矛盾，凸显了对中立基准测...

AIGC 2023-12-22 人工智能

726阅读

摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo

前段时间，谷歌发布了对标 OpenAI GPT 模型的竞品 ——Gemini。这个大模型共有三个版本 ——Ultra（能力最强）、Pro 和 Nano。研究团队公布的测试结果显示，Ultra 版本在许多任务中优于 GPT4，而 Pro 版本与 GPT-3...

人工智能 2023-12-20 人工智能

697阅读

Gemini自曝文心一言牵出重大难题，全球陷入高质量数据荒？2024年或将枯竭

谷歌Gemini，又出丑闻了！昨天上午，网友们激动地奔走相告：Gemini承认自己是用文心一言训练中文语料的。国外大模型用中国模型产生的中文语料训练，这听起来就是个段子，结果段子竟然成现实了，简直魔幻。微博大V「阑夕」夜亲自下场，在Poe网站上实...

AIGC 2023-12-19 人工智能

665阅读

ChatGPT构建离不开PyTorch，LeCun言论引热议，模型厂商不开放权重原来为此

这两天，有关开源的话题又火了起来。有人表示，「没有开源，AI 将一无所有，继续保持 AI 开放。」这个观点得到了很多人的赞同，其中包括图灵奖得主、Meta 首席科学家 Yann LeCun。想象一下，如果工业界的 AI 研究实验室仍然封闭、没有开源代码...

人工智能 2023-12-18 人工智能

702阅读

GPT-4.5秘密解禁？网友灰度测试全网热议，OpenAI研究员回应全是幻觉

GPT-4.5，难道已经瞒着我们悄悄上线了？最近，许多网友都发现了一件令人震惊的事情。图片如果问ChatGPT「你在API里是如何命名的」，它居然会回答，自己的名字是「gpt-4.5-turbo」！图片而且，不少网友都有类似的发现：图片图片...

AIGC 2023-12-18 人工智能

797阅读

人工智能中的文本分类：技术突破与实战指导

在本文中，我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用，以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用，旨在提供对文本分类技术深入理解的全面视角。关注TechLead，分享A...

生成式AI 2023-12-15 人工智能

811阅读

24 LLM错误代码补全：机器学习顶会NeurIPS‘23 智能体评估：自行构建数据集Buggy-HumanEval、Buggy-FixEval+错误代码补全+修复模型【网安AIGC专题11.22】

Large Language Models of Code Fail at Completing Code with Potential Bugs 写在最前面论文名片对于命名实体识别、关系抽取任务的启发课堂讨论实验自己构建的数据集...

人工智能 2023-12-14 人工智能

798阅读

微软小模型击败大模型：27亿参数，手机就能跑

上个月，微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源，在常识推理、语言理解和逻辑推理方面的性能显著改进。今天，微软公布了 Phi-2 模型的更多细节以及全新的提示技术 promptbase。这个仅 27 亿参...

人工智能 2023-12-13 人工智能

660阅读

Hugging News #0814: Llama 2 学习资源大汇总

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」。本期 Hugging News 有哪些有趣...

生成式AI 2023-12-13 人工智能

674阅读

全方位、无死角的开源，邢波团队LLM360让大模型实现真正的透明

开源模型正展现着它们蓬勃的生命力，不仅数量激增，性能更是愈发优秀。图灵奖获得者 Yann LeCun 也发出了这样的感叹：「开源人工智能模型正走在超越专有模型的路上。」专有模型在技术性能和创新能力上展现了非凡的力量，但是它们不开源的性质成为 LLM 发...

人工智能 2023-12-13 人工智能

739阅读

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

大模型现在真的是越来越卷了！ 11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。谷歌被逼急了，赶在年底之前仓促发布了超大模型Gemini，卷起了多模态，甚至不惜「视频造假」。就在今天，微软正式发布了曾在11...

生成式AI 2023-12-13 人工智能

703阅读

LLaMA(大规模机器学习和分析)

LLaMA(大规模机器学习和分析是一个先进的软件平台，是Meta 推出 AI 语言模型 LLaMA，一个有着上百亿数量级参数的大语言模型用于大规模部署和管理机器学习模型。借助LLaMA，组织可以高效地在大型数据集上训练和部署模型，缩短投放市场的...

人工智能 2023-12-12 人工智能

789阅读

ChatGPT模型在神经学考试中表现出色，超越人类学生水平

近期发表在JAMA Network Open期刊的一项研究中，研究人员评估了两个ChatGPT大型语言模型（LLMs）在回答美国精神病学和神经学委员会问题库的问题时的表现。他们比较了这两个模型在低阶和高阶问题上的结果与人类神经学生的表现。研究发现，其中一个...

大数据 2023-12-11 人工智能

640阅读

像调鸡尾酒一样调制多技能大模型，智源等机构发布LM-Cocktail模型治理策略

随着大模型技术的发展与落地，「模型治理」已经成为了目前受到重点关注的命题。只不过，在实践中，研究者往往感受到多重挑战。一方面，为了高其在目标任务的性能表现，研究者会收集和构建目标任务数据集并对大语言模型（LLM）进行微调，但这种方式通常会导致除目标任务...

生成式AI 2023-12-11 人工智能

650阅读

外包数据注释服务如何增强人工智能模型？

在人工智能(AI 和机器学习(ML 领域，基础在于数据，数据的质量、准确性和深度直接影响人工智能系统的学习和决策能力。数据有助于丰富机器学习算法数据集的数据注释服务，对于教导AI系统识别模式、做出预测和提高整体性能至关重要。通过高质量数据注释为ML模...

AIGC 2023-12-11 人工智能

667阅读

大语言模型之十六-基于LongLoRA的长文本上下文微调Llama-2

增加LLM上下文长度可以提升大语言模型在一些任务上的表现，这包括多轮长对话、长文本摘要、视觉-语言Transformer模型的高分辨4k模型的理解力以及代码生成、图像以及音频生成等。对长上下文场景，在解码阶段，缓存先前token的Key和Value（K...

AIGC 2023-12-09 人工智能

1031阅读

“大海捞针”实验验证RAG+GPT-4 Turbo模型卓越性能只需4%的成本

近期的“大海捞针”实验揭示了RAG+GPT-4Turbo模型的卓越性能，只需4%的成本，便能在生成响应时实现卓越的准确性。这标志着大型模型领域的一次重要突破。在这个实验中，研究者使用了三种基本技术，包括上下文窗口填充、RAG（检索增强生成）和微调，以使L...

大数据 2023-12-08 人工智能

683阅读

高考测试成绩接近满分！夸克自研大模型通过备案

快科技12月8日消息，据国内媒体报道，日前，阿里智能信息事业群自研的夸克大模型已通过备案，将陆续在通识、健康、创作等领域升级内容产品与智能工具，落地一系列 AIGC 应用。夸克相关负责人表示，夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。...

人工智能 2023-12-08 人工智能

644阅读

视觉CV-AIGC一周最新技术精选(2023-11)

PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型（LMM）扩...

生成式AI 2023-12-08 人工智能

698阅读

确定数据分布正态性的11种基本方法

在数据科学和机器学习领域，许多模型都假设数据呈现正态分布，或者假设数据在正态分布下表现更好。例如，线性回归假设残差呈正态分布，线性判别分析（LDA）基于正态分布等假设进行推导。因此，了解如何测试数据正态性的方法对于数据科学家和机器学习从业者至关重要。...

生成式AI 2023-12-07 人工智能

731阅读

思维链提出者Jason Wei：关于大模型的6个直觉

还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作，并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研...

生成式AI 2023-12-07 人工智能

688阅读

思维链提出者Jason Wei：关于大模型的六个直觉

还记得 Jason Wei 吗？这位思维链的提出者还曾共同领导了指令调优的早期工作，并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI...

大数据 2023-12-07 人工智能

672阅读

大语言模型分布式训练的量化分析与优秀实践,以 GPT-175B 为例

一、Transformer 大语言模型的 SOTA 训练技术 1、大语言模型的发展背景与挑战首先和大家分享下大语言模型的发展背景。过去的几年内，无论从数据量的维度还是从模型规模的维度，语言模型规模都扩大了非常多的数量级。随着数据量和模型规模的扩大，也...

AIGC 2023-12-07 人工智能

731阅读

颠覆Transformer霸权！CMU普林斯顿推Mamba新架构，解决致命bug推理速度暴增5倍

深度学习进入新纪元，Transformer的霸主地位，要被掀翻了？ 2017年6月12日横空出世，让NLP直接变天，制霸自然语言领域多年的Transformer，终于要被新的架构打破垄断了。 Transformer虽强大，却有一个致命的bug：核心注意力...

AIGC 2023-12-05 人工智能

1034阅读

大模型版“5年高考3年模拟”来了！6141道数学题，还是多模态的那种

大模型的“5年高考3年模拟”数学题来了，还是加强强强版！微软、加州大学洛杉矶分校（UCLA）、华盛顿大学（UW）联合打造全新多模态数学推理基准数据集。名为“MathVista”。涵盖各种题型共6141个问题，来源于28个现有的多模态数据集和3个新标...

生成式AI 2023-12-05 人工智能

767阅读

GPT-4 未通过图灵测试，GPT-3.5 还败给六十年前的老 AI 系统，最新研究出炉！

过去一年间，能说会道的ChatGPT、最新的 GPT-4大模型，其能力也已超乎很多人的想象，一场由 OpenAI 引领推动的 AIGC 浪潮席卷全球各大科技公司。但是从学术研究的角度来看，其表现力距离人类智能究竟还有多远? 近日，一篇由加州大学圣迭戈分校的...

大数据 2023-12-05 人工智能

668阅读

性能直追GPT-4，5000个H100训成！DeepMind联创发全新一代大模型

最近，InflectionAI发布了全新的一款AI模型。更炸裂的是InfectionAI对这款模型的评价——性能直超谷歌和Meta开发的两款模型，紧随OpenAI的GPT-4之后。到底是什么样的表现让InflectionAI能夸下如此海口呢？在介绍...

大数据 2023-12-05 人工智能

777阅读

【极客技术】真假GPT-4？微调 Llama 2 以替代 GPT-3.5/4 已然可行！

近日小编在使用最新版GPT-4-Turbo模型（主要特点是支持128k输入和知识库截止日期是2023年4月）时，发现不同商家提供的模型回复出现不一致的情况，尤其是模型均承认自己知识库达到2023年4月，但当我们细问时，Fake GPT4-Turbo（暂且这...

人工智能 2023-12-05 人工智能

738阅读

微调语言大模型选LoRA还是全参数？基于LLaMA 2深度分析

本文对比了全参数微调和LoRA，并分析了这两种技术各自的优势和劣势。作者使用了三个真实用例来训练LLaMA 2模型，这提供了比较特定任务的性能、硬件要求和训练成本的基准。本文证明了使用LoRA需要在serving效率和模型质量之间做出权衡，而这...

AIGC 2023-12-05 人工智能

862阅读

不是大模型全局微调不起，只是LoRA更有性价比，教程已经准备好了

增加数据量和模型的参数量是公认的提升神经网络性能最直接的方法。目前主流的大模型的参数量已扩展至千亿级别，「大模型」越来越大的趋势还将愈演愈烈。这种趋势带来了多方面的算力挑战。想要微调参数量达千亿级别的大语言模型，不仅训练时间长，还需占用大量高性能的内存资...

AIGC 2023-12-04 人工智能

850阅读

机器学习 - 混淆矩阵：技术与实战全方位解析

本文深入探讨了机器学习中的混淆矩阵概念，包括其数学原理、Python实现，以及在实际应用中的重要性。我们通过一个肺癌诊断的实例来演示如何使用混淆矩阵进行模型评估，并提出了多个独特的技术洞见。文章旨在为读者提供全面而深入的理解，从基础到高级应用。...

AIGC 2023-12-04 人工智能

906阅读

文字序顺不响影GPT-4阅读理解，别的大模型都不行

研表究明，汉字序顺并不定一影阅响读（对于英文来说，则是每一个单词中的字母顺序）。现在，日本东京大学的一项实验发现，这个“定理”居然也适合GPT-4。比如面对这样一段“鬼画符”，几乎里面每一个单词的每一个字母都被打乱： oJn amRh wno het...

大数据 2023-12-04 人工智能

680阅读

一言不合就跑分，国内AI大模型为何沉迷于“刷榜”

“不服跑个分”这句话，相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件，由于能够在一定程度上反映手机的性能，因此备受玩家的关注。同理在PC处理器、显卡上，同样也有相应的跑分软件来衡量它们的性能。既然“万物皆可跑分”，...

大数据 2023-12-03 人工智能

696阅读

AIGC时代，大模型微调如何发挥最大作用？

人工智能的快速发展推动了大模型的广泛应用，它们在语言、视觉、语音等领域的应用效果已经越来越好。但是，训练一个大模型需要巨大的计算资源和时间，为了减少这种资源的浪费，微调已经成为一种流行的技术。微调是指在预训练模型的基础上，通过在小数据集上的训练来适应新的任...

人工智能 2023-12-03 人工智能

889阅读

北大最新多模态大模型开源：在混合数据集上训练，无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型，只需3天！北大和中山大学团队又出招了——在最新研究中，研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架，可以大大减少VLM（视觉语言大模型）在训练和推理过程中的开销。具体而言，团队按照提出的新框架...

人工智能 2023-11-29 人工智能

714阅读

斯坦福华人博士文生视频Pika 1.0爆火！4人公司估值2亿，OpenAI联创参投

【新智元导读】仅有四人的初创公司，已经融资5500万美元，融资名单几乎集齐了硅谷的半壁江山，半年用户超50万，今天，Pika1.0闪亮登场，电影级特效震撼全网。 Runway Gen-2最强竞品Pika，暌违半年忽然放出大招——Pika1.0正式发布! 仅...

大数据 2023-11-29 人工智能

874阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1304阅读

AI视野：Azure AI新增40种大模型；Yi-34B-Chat微调模型开源；GPT-4在图灵测试中成功率超过41%；微软谷歌推出AI入门课程

???AI新鲜事微软Azure AI新增40种大模型微软宣布在Azure AI云开发平台中新增40个大模型，包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等，支持文本生成、图像处...

AIGC 2023-11-27 人工智能

841阅读

看百度文心一言实力，再聊ChatGPT触类旁通的学习能力如何而来？

图文原创：亲爱的数据美国大模型水平领先，国内大模型蓄势而发。国内大模型参与者众多，百度文心一言第一个有勇气站出来发布。此处应有掌声。事前事后，中国网友的呐喊声不绝于耳：“文心一言到底什么水平啊？” 其实网友更想知道：国内A...

生成式AI 2023-11-27 人工智能

732阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1232阅读

GPT成熟之路官方笔记 | OpenAI开发者日

ChatGPT产品打造的细节，现在OpenAI自己交了个底。并且这波干货分享真是信息量满满，包括但不限于： ChatGPT背后的产品和研发团队如何协作大模型应用如何从原型走向成熟 OpenAI如何优化大模型性能…… 以上信息，依然来自今年的新晋...

人工智能 2023-11-26 人工智能

696阅读

【网安AIGC专题11.1】11 Coreset-C 主动学习：特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)

Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面论文名片先验知识的补充主动学习采样函数 benchmark基准和base...

大数据 2023-11-25 人工智能

849阅读

AI生成视频入局新卷王，上线不到48小时，网友“大片”刷屏X

AI视频生成工具卷起来了! 本周二，Stability AI低调发布了首个开源AI视频模型Stable Video Diffusion（以下简称SVD），同时还晒出测试数据称，SVD的模型性能碾压RunwayML、Pika Labs等领先的闭源商业模型。...

AIGC 2023-11-24 人工智能

805阅读

历数5年89篇研究，这篇综述告诉我们深度学习中的代码数据增强怎么样了

当今深度学习以及大模型的飞速发展，带来了对创新技术的不断追求。在这一进程中，代码数据增强技术显现出其不可忽视的价值。最近，由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...

大数据 2023-11-23 人工智能

703阅读

新的生图模型DeepFloyd IF来了，可以拳打Stable Diffusion，脚踢Dall-E？

简介： Stability AI与它的多模式AI研究实验室DeepFloyd共同宣布研究版本DeepFloyd IF的发布,这是一款强大的文text-to-image级联像素扩散模型（cascaded pixel diffusion model），复现了...

大数据 2023-11-22 人工智能

1059阅读

教你如何使用PyTorch解决多分类问题

本文分享自华为云社区《使用PyTorch解决多分类问题：构建、训练和评估深度学习模型》，作者：小馒头学Python。引言当处理多分类问题时，PyTorch是一种非常有用的深度学习框架。在这篇博客中，我们将讨论如何使用PyTorch来解决多分类...

人工智能 2023-11-22 人工智能

664阅读