-
OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议
Q* 【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文,猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI,已是临门一脚了? Ope...
-
LLMs:Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略
LLMs:Chinese-LLaMA-Alpaca-2(基于deepspeed框架 的简介、安装、案例实战应用之详细攻略 导读:2023年07月31日,哈工大讯飞联合实验室,发布Chinese-LLaMA-Alpaca-2,本项目基于Meta发布的...
-
【网安AIGC专题11.1】11 Coreset-C 主动学习:特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)
Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面 论文名片 先验知识的补充 主动学习 采样函数 benchmark基准和base...
-
Meta AI研究团队新AI模型: Llama 2 大语言模型
Llama是Facebook Research团队开发的基础语言模型集,旨在提供广泛的语言理解能力。它基于转换器架构,参数范围从7B到65B。通过使用Llama模型,研究人员和开发人员可以构建更先进的自然语言处理系统。您可以在GitHub上找到相关的代...
-
AIGC数据处理与存储解决方案
针对在AIGC的场景下,如何解决在AIGC训练过程中数据的存储和数据处理的问题,杨冠军从三个方面进行介绍与解读: 一是AIGC对存储提的新需求; 二是介绍腾讯云可以给用户提供的整体存储解决方案; ...
-
使用QLoRA对Llama 2进行微调的详细笔记
使用QLoRA对Llama 2进行微调是我们常用的一个方法,但是在微调时会遇到各种各样的问题,所以在本文中,将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的,大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 导入库...
-
如何创建 LoRA 并应用到 Stable Diffusion WebUI 里
本着觉知此事要躬行的态度,笔者没有去看任何国内的教程,依靠着纯粹在 Github 上翻阅原版代码仓库,找到了解决方案 准备数据集 LoRA 的特点就是几张图就够,并且不需要复杂的文本注释。 所以,你的数据集,就是一堆散装照片,缩放到正确的尺寸 (5...
-
【多模态】4、Chinese CLIP | 专为中文图文匹配设计
文章目录 一、背景 二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸 三、效果 四、代码 4.1 推理 论文:Chinese CLIP: Contrastive Vision-Language Pr...
-
Stable Diffusion — ControlNet 超详细讲解
Stable Diffusion — ControlNet 超详细讲解 ControlNet 最近非常火?!ControlNet 和 Stable Diffusion 的结合使 Stable Diffusion 能够接受指导图像生成过程的条件输入,从而增...
-
PBT集团表示,数据质量对训练ChatGPT至关重要
距离OpenAI向公众发布ChatGPT已经接近一年,其采纳率呈现了前所未有的飙升。截至2023年2月,据路透社报道,ChatGPT拥有大约1亿活跃用户。快进到9月,ChatGPT网站吸引了近15亿访问者,展示了该平台在当今数字领域中的巨大流行和重要作用。...
-
LLaMA-2论文阅读
1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代,跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍,从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...
-
研究显示 ChatGPT 可为科学假说生成虚假数据集,对学术诚信造成威胁
11 月 24 日消息,据《自然》杂志当地时间周三报道,本月初发表在《美国医学会眼科学杂志》上的一篇论文中,作者使用了聊天机器人 GPT-4 和高级数据分析工具 ADA 创建了一个虚假的临床试验数据集,从而支持一个“未经证实”的科学主张。 IT之家注:...
-
whisper语音识别部署及WER评价
1.whisper部署 详细过程可以参照:? 创建项目文件夹 mkdir whisper cd whisper conda创建虚拟环境 conda create -n py310 python=3.10 -c conda-forge...
-
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
最近,除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。 首先,作为最早探索视频生成领域的领头羊之一,Runway 升级了其 Gen-2 模型,带来了电影级别的高清晰度,令人瞩目,并称视频生成的一致性得到了重大改进。 但...
-
Hugging Face最受欢迎15大AI机构出炉!清华第五,OpenAI第十,冠军竟是它?
【新智元导读】Hugging Face作为开源AI社区的代表,总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里,哪些机构对于开源AI贡献最大。 Hugging Face上最受欢迎的15个AI公司出炉了! 目前的冠军,是Stability AI...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
美国空军部首席数据和AI官谈领先的AI运营和战略优势
AI正在改变我们几乎做每件事的方式,包括美国如何打仗、监控威胁和维护国防。AI的作用对军事战略和能力至关重要,以至于美国空军和太空部队今年任命了第一位首席AI官。 今年春季,美国空军部(DAF)任命Eileen Vidrine为首席数据和AI官。在接受任...
-
牛津大学AI研究员发出警告:大语言模型对科学真相构成风险
在最新的一篇研究中,牛津大学互联网研究所的人工智能研究员发出了对大语言模型(LLMs)对科学真相构成威胁的警告。由Brent Mittelstadt、Chris Russell和Sandra Wachter等研究员在《自然人类行为》期刊上发表的论文中,他们...
-
AI绘画使用Stable Diffusion(SDXL)绘制玉雕风格的龙
一、引言 灵感来源于在逛 LibLib 时,看到的 Lib 原创者「熊叁gaikan」发布的「翠玉白菜 sdxl|玉雕风格」 的 Lora 模型。简直太好看了,一下子就被吸引了! 科普下「翠玉白菜」: 翠玉白菜是由翠玉所琢碾出白菜形状的清代文...
-
清华大学提出全新加速训练大模型方法SoT
近日,微软研究和清华大学的研究人员共同提出了一种名为“Skeleton-of-Thought(SoT)”的全新人工智能方法,旨在解决大型语言模型(LLMs 生成速度较慢的问题。 尽管像GPT-4和LLaMA等LLMs在技术领域产生了深远影响,但其处理速度的...
-
【GPT4】微软 GPT-4 测试报告(3)GPT4 的编程能力
欢迎关注【youcans的GPT学习笔记】原创作品,火热更新中微软 GPT-4 测试报告(1)总体介绍微软 GPT-4 测试报告(2)多模态与跨学科能力微软 GPT-4 测试报告(3)GPT4 的编程能力 【GPT4】微软 GPT-4 测试...
-
Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型
内容来源:@xiaohuggg Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型 该模型是由Hugging Face团队开发,它在Whisper核心功能的基础上进行了优化和简化,体积缩小了50%。速度提高了6倍。并...
-
AI视野:飞书智能伙伴发布;OpenAI曝光Q*项目;微软12月1日向中国开放Copilot;Grok下周将向x的Premium+订阅用户推出
???AI新鲜事 微软12月1日向中国开放Copilot 微软将在今年12月1日面向中国大陆的企业和教育机构推出,基于网页的生成式AI聊天助手 ——Copilot,那些无法使用ChatGPT的小伙伴们可以体验Copilot。 xAI的聊天机器人Grok...
-
Stable Diffusion如何生成高质量的图-prompt写法介绍
文章目录 Stable Diffusion 使用 尝试下效果 prompt的编写技巧 prompt 和 negative prompt Prompt格式 Prompt规则细节 优化 Guidance Scale 总结 Sta...
-
Real AI发布欧洲首个人本主义开源大语言模型项目HOMINIS
在贝尔格莱德于2023年11月23日举办的数据科学大会上,Real AI宣布成功中标ISCRA项目。Real AI将建设欧洲首个基于LEONARDO超级计算机的人本主义大语言模型(LLM)。 LEONARDO超级计算机位于博洛尼亚的CINECA数据中心,是...
-
大宗商品贸易集团数据治理实践,夯实数字基座 | 数字化标杆
某大型央企是首批全国供应链创新与应用示范企业,在“十四五”规划期内以聚焦供应链管理核心主业作为主要战略发展方向。供应链运营管理以大宗商品贸易为主,其交易往往具有交易量巨大、交易环节复杂、风险交易难识别、风险客商难管控等痛点。 随着集团数字化转型不断深化,...
-
历数5年89篇研究,这篇综述告诉我们深度学习中的代码数据增强怎么样了
当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。 最近,由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...
-
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点
【新智元导读】最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一L...
-
GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”
学术造假有了GPT-4,变得更容易了。 这两天,一篇刊登在Nature上的新闻表示,GPT-4生成的造假数据集,第一眼还真不一定看得出来。 除非请来业内专家仔细对数据集进行评估,才能发现个中细节的不合理性。 这个新闻的来源是一篇发表在JAMA Ophth...
-
CART算法解密:从原理到Python实现
本文深入探讨了CART(分类与回归树)算法的核心原理、实现方法以及应用场景。文章首先介绍了决策树的基础知识,然后详细解析了CART算法的工作机制,包括特征选择和树的构建。接着,通过Python和PyTorch的实例代码展示了CART算法在实际问题中的应用。...
-
吴恩达AIGC《How Diffusion Models Work》笔记
1. Introduction Midjourney,Stable Diffusion,DALL-E等产品能够仅通过Prompt就能够生成图像。本课程将介绍这些应用背后算法的原理。 课程地址:https://learn.deeplearning...
-
聊一聊高精地图的数据问题,无图感知还有哪些坑要踩?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在自动驾驶领域,高精地图在定位、规划和避碰等方面发挥着至关重要的作用,实现行车安全和高质量路线预测。然而高精地图的构建都是昂贵、复杂的,而且专业性很强,无论是在硬件组成还是软件及其所使用的算法方面。...
-
微调 Code Llama 完整指南
一、前言 今天这篇文章将向大家详细介绍如何对 Code Llama 进行微调,让它变成适合 SQL 开发的有利工具。对于编程开发任务,经过适当微调后的 Code Llama 的性能通常都会比普通的 Llama 强很多,特别是当我们针对具体任务进行优化时:...
-
新的生图模型DeepFloyd IF来了,可以拳打Stable Diffusion,脚踢Dall-E?
简介: Stability AI与它的多模式AI研究实验室DeepFloyd共同宣布研究版本DeepFloyd IF的发布,这是一款强大的文text-to-image级联像素扩散模型(cascaded pixel diffusion model),复现了...
-
南开大学与字节跳动研究人员推出开源AI工具ChatAnything:用文本描述生成虚拟角色
南开大学与字节跳动研究人员合作推出了一项引人注目的研究,发布了一种名为ChatAnything的全新AI框架。该框架专注于通过在线方式生成基于大型语言模型(LLM)的角色的拟人化形象,从而创造具有定制视觉外观、个性和语调的人物。 简答的说,ChatAnyt...
-
Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快
Stable Diffusion官方终于对视频下手了—— 发布生成式视频模型Stable Video Diffusion(SVD)。 Stability AI官方博客显示,全新SVD支持文本到视频、图像到视频生成: 并且还支持物体从单一视角到多视角的...
-
LLMs之LLaMA:《LLaMA: Open and Efficient Foundation Language Models》翻译与解读
LLMs之LLaMA:《LLaMA: Open and Efficient Foundation Language Models》翻译与解读 导读:该论文提出了一个开源的大规模语言模型LLaMA,2048个A100-80G训练21天。该...
-
通用人工智能(AGI)离我们还有多远
人工智能(AI)是当今科技领域最热门和最具影响力的话题之一,它已经渗透到了我们生活和工作的方方面面,从电影推荐和语音助手,到自动驾驶和医疗诊断。AI的发展也引发了人们对未来的想象和期待,尤其是对通用人工智能(Artificial General Inte...
-
KAUST研究团队推出大模型心智交互框架CAMEL 教AI Agents学会协作与竞争
近期,KAUST研究团队推出的CAMEL框架引起了广泛关注。该框架以角色扮演为基础,使AI Agents在复杂任务中能够协作和竞争,产生惊人的群体智能效果。NeurIPS2023录用的这一项目探索了大型语言模型(LLMs)领域的新方向。 项目地址:htt...
-
教你如何使用PyTorch解决多分类问题
本文分享自华为云社区《使用PyTorch解决多分类问题:构建、训练和评估深度学习模型》,作者: 小馒头学Python。 引言 当处理多分类问题时,PyTorch是一种非常有用的深度学习框架。在这篇博客中,我们将讨论如何使用PyTorch来解决多分类...
-
Stable Video Diffusion来了,代码权重已上线
AI 画图的著名公司 Stability AI,终于入局 AI 生成视频了。 本周二,基于 Stable Diffusion 的视频生成模型 Stable Video Diffusion 来了,AI 社区马上开始了热议。 很多人都表示「我们终于等到了」...
-
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插
LLMs之Colossal-LLaMA-2:源码解读(train.py文件 基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件 →数据预处理(初始化分词器+数据处理器+数据加载器 ...
-
计算机视觉中目标检测的数据预处理
本文涵盖了在解决计算机视觉中的目标检测问题时,对图像数据执行的预处理步骤。 首先,让我们从计算机视觉中为目标检测选择正确的数据开始。在选择计算机视觉中的目标检测最佳图像时,您需要选择那些在训练强大且准确的模型方面提供最大价值的图像。在选择最佳图像时,考...
-
美国空军的首席数据和AI官谈如何通过AI获得战略优势
AI正在改变我们做事情的方式,这包括将其应用于军事、监控威胁和保障国防。AI对军事战略和能力已变得日益重要,正因为如此,美国空军和航天部队今年任命了第一位首席AI官。 今年春天,美国空军任命Eileen Vidrine为首席数据和AI官,被任命后,V...
-
Nvidia和Genentech合作利用人工智能加速药物发现
Nvidia正在与生物技术巨头基因泰克公司(Genentech)合作,双方计划利用多年时间把最先进的人工智能功能(包括生成式AI)用于加速药物发现研究。 Nvidia表示,希望通过将其生成式AI模型和算法转变为“下一代AI平台”来加强Genentech...
-
Vectara排行榜:OpenAI的GPT-4在文档摘要中幻觉率最低
在一项由Vectara进行的开源模型评估中,OpenAI的GPT-4在文档摘要中表现卓越,凭借其出色的97%准确率和令人瞩目的3%的幻觉率,成为幻觉率最低的大型语言模型。 Vectara在GitHub上发布了一个排行榜,评估了一些大型语言模型在其“Hall...
-
最新!基于视觉方案的车辆速度、距离估计综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文名称:Vision-based Vehicle Speed Estimation: A Survey 导读 在精确检测车速车距的方案中,视觉方案是非常具有挑战性的,但由于没有昂贵的距离传感器而大幅...
-
Stability AI推出视频生成模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Di...
-
【文心一言 vs. 通义千文】一言对千问:自百度之后,阿里终于还是出手了——通义千问
通义千问 : https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录 通义千问 : 达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...
-
【AIGC】ChatGPT能上传文件了,文档图片数据集秒理解,代码一键执行
文章目录 前言 正文 Python支持的ChatGPT都能干 应用场景 文档理解和摘要 图片分析和描述 数据集处理和分析 文件搜索和检索 任务协作和知识共享 总结 写在最后 前言 在过去的几年中,人工智能技术取得了巨大的进展,...