数据集第33页 - AIGC资讯

补齐Transformer规划短板，田渊栋团队的Searchformer火了

最近几年，基于 Transformer 的架构在多种任务上都表现卓越，吸引了世界的瞩目。使用这类架构搭配大量数据，得到的大型语言模型（LLM）等模型可以很好地泛化用于真实世界用例。尽管有如此成功，但基于 Transformer 的架构和 LLM 依然难...

大数据 2024-02-26 人工智能

793阅读

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。为什么 Sora...

人工智能 2024-02-26 人工智能

709阅读

GPT-4正接管人类数据专家！先验知识让LLM大胆预测，准确率堪比传统方式

在数据科学中，AI研究员经常面临处理不完整数据集的挑战。然而，许多已有的算法根本无法处理「不完整」的数据序列。传统上，数据科学家会求助于专家，利用他们的专业知识来填补空白，然而这一过程既耗时，却又不实用。如果AI可以接管专家的角色，又会如何呢？近...

大数据 2024-02-26 人工智能

746阅读

谷歌Gemini生图功能紧急关闭，口碑一夜塌房，Yann LeCun：我早就知道

去年年底，谷歌 Gemini 震撼了业界，它是谷歌「最大、最有能力和最通用」的 AI 系统，号称第一个原生多模态大模型，能力超越 GPT-4，也被认为是谷歌反击微软和 OpenAI 的强大工具。对此，在 2 月 8 日，谷歌还把自家对标 ChatGPT...

AIGC 2024-02-26 人工智能

774阅读

一手借东风，Reddit把用户「卖」了个好价钱；AI增强搜索工具清单(私藏版)；2024年Star飙升的LLM学习路线图；AIGC教育行业全景报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 国产大模型进入生态构建阶段，纷纷出炉开发者激励计划 https://www.moonshot.cn 2月5日，月之暗面 Moonsho...

生成式AI 2024-02-25 人工智能

851阅读

AI写作助手：会重复吗？一篇文章帮你解答！

大家好，今天来聊聊AI写作助手：会重复吗？一篇文章帮你解答！，希望能给大家提供一点参考。以下是针对论文AI辅写率高的情况，提供一些修改建议和技巧，可以借助此类工具：还有： AI写作助手：会重复吗？一篇文章帮你解答！随着人工智能技术的快...

人工智能 2024-02-25 人工智能

2036阅读

AIGC基础：大型语言模型 (LLM) 为什么使用向量数据库，嵌入(Embeddings)又是什么？

嵌入：它是指什么？嵌入是将数据（例如文本、图像或代码）转换为高维向量的数值表示。这些向量捕捉了数据点之间的语义含义和关系。可以将其理解为将复杂数据翻译成 LLM 可以理解的语言。为什么有用？原始数据之间的相似性反映在高维空间中对应向量之间的距离上。...

大数据 2024-02-25 人工智能

957阅读

AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人

From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations From Audio to Photoreal Embodiment:Synthesizing Humans...

人工智能 2024-02-24 人工智能

909阅读

CUDA驱动深度学习发展 - 技术全解与实战

全面介绍CUDA与pytorch cuda实战关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，项目管理专业人士，上亿营收...

AIGC 2024-02-24 人工智能

894阅读

Reddit IPO文件曝光，OpenAI的Sam Altman被列为重要股东

在Reddi最新的IPO文件中，OpenAI首席执行官Sam Altman成为Reddit Inc.的一位重要股东，持有Reddit8.7%的股份，包括789，456股A类股和11.4百万股B类股。 Altman与Reddit有着长期的紧密联系，曾与Red...

人工智能 2024-02-23 人工智能

788阅读

AIGC从入门到入坑01（初学者适用版）

AIGC从入门到入坑系列文章 AIGC系列第一章--简述 AIGC从入门到入坑系列文章前言学习路径 AI时间线人工智能简史 AI绘画简史 AI名词解释小白从0-1必看5篇资料初学者进阶必读8篇资料总结前...

人工智能 2024-02-23 人工智能

1210阅读

AI绘画专栏之Comfyui之AnimateDiffLCM更快效果更佳工作流分享

AnimateLCM能够在很少的步骤中生成高质量的视频。相比直接在原始视频数据集上应用一致性学习，该项目提出了一种解耦的一致性学习策略，分别对图像生成的基础知识和运动生成的基础知识进行提炼。这种策略提高了训练效率并提升了生成视频的视觉质量。那么关于两个...

人工智能 2024-02-23 人工智能

1258阅读

鱼眼相机与超声波传感器融合实现鸟瞰近场障碍物感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文链接：https://browse.arxiv.org/pdf/2402.00637.pdf 视频链接：https://youtu.be/JmSLBBL9Ruo 本文介绍了鱼眼相机与超声传...

生成式AI 2024-02-23 人工智能

847阅读

目标检测新SOTA：YOLOv9问世，新架构让传统卷积重焕生机

继 2023 年 1 月 YOLOv8 正式发布一年多以后，YOLOv9 终于来了！我们知道，YOLO 是一种基于图像全局信息进行预测的目标检测系统。自 2015 年 Joseph Redmon、Ali Farhadi 等人提出初代模型以来，领域内的研...

生成式AI 2024-02-23 人工智能

894阅读

清华叉院、理想提出DriveVLM，视觉大语言模型提升自动驾驶能力

与生成式 AI 相比，自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统，人们面临的主要挑战是 AI 的场景理解，这会涉及到复杂、不可预测的场景，例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括...

大数据 2024-02-23 人工智能

863阅读

EfficientViT-SAM：精度不变原地起飞！

作者提出了EfficientViT-SAM，这是一系列加速的SAM模型。在保留SAM轻量级的提示编码器和 Mask 解码器的同时，作者用EfficientViT替换了沉重的图像编码器。在训练方面，首先从SAM-ViT-H图像编码器向EfficientV...

大数据 2024-02-23 人工智能

1047阅读

AIGC内容分享(五十九)：拐点时刻？AIGC时代的新闻业

目录前言大洗牌：新闻业的三重变革涌现：AIGC正掀起一场 “供给侧改革”之外：达克摩斯之剑： AIGC时代结语：前言一阵生成式人工智能(AIGC 的旋风，正在席卷众多领域。 2022年底，OpenAI发布自然语言对话...

人工智能 2024-02-23 人工智能

1098阅读

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因...

生成式AI 2024-02-22 人工智能

909阅读

使用Stable Diffusion完成绘图

2.2 使用Stable Diffusion完成绘图 Stable diffusion 由于其开源特性，发展极为迅猛，可以说很多效果超过了 Midjourney 也完全不过分，知识系统十分庞杂，他是有两个公司运营研发，WebUI和sd的ckpt文件都...

人工智能 2024-02-22 人工智能

1041阅读

模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的 2023 年中，大型语言模型（LLM）在潜力和复杂性方面都获得了飞速的发展。展望 2024 年的开源和研究进展，似乎我们即将进入一个可喜的新阶段：在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。现在，2024 年的第一个月已经过去...

AIGC 2024-02-22 人工智能

969阅读

【AI绘画】硬核解读Stable Diffusion（完整版）小白必收藏！！！

手把手教你入门绘图超强的AI绘画，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取） 2022年可谓是AIGC（AI Generated Content）元年，上半年有文生图大模型DALL-E2和Sta...

大数据 2024-02-22 人工智能

1159阅读

Karpathy离职OpenAI，首发2小时AI大课！从头开始构建GPT分词器

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer（分词器）」。其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。这个项目是minbpe——专为...

人工智能 2024-02-22 人工智能

762阅读

LLaMA 2 和 QianWen-14B

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型 - 科技新闻 - EDA365电子论坛网 LLaMA 2 的硬件要求： LLaMA 2 系列模型有不同的参数量版本，如7B、13B和70B等。对于不同大小的模型，其硬件需求也有所不同。以...

生成式AI 2024-02-22 人工智能

1254阅读

超越AF2？Iambic、英伟达、加州理工学院开发多尺度深度生成模型，进行状态特异性蛋白质-配体复合物结构预测

由蛋白质和小分子配体形成的结合复合物无处不在，对生命至关重要。虽然最近科学家在蛋白质结构预测方面取得了进展，但现有算法无法系统地预测结合配体结构及其对蛋白质折叠的调节作用。为了解决这种差异，AI 制药公司 Iambic Therapeutics、英伟达...

大数据 2024-02-22 人工智能

898阅读

网络安全中的机器学习：挑战与比较

在数字互联时代，机器学习(ML 在网络安全防御中的作用已变得不可或缺。机器学习算法能够识别大量数据集中的模式和异常，为预防和减轻网络威胁提供了一条有前景的途径。然而，在乐观的情绪中，也存在着许多必须解决的挑战，才能在网络安全领域有效地利用机器学习。...

人工智能 2024-02-22 人工智能

766阅读

[AIGC 大数据基础]hive浅谈

在当今大数据时代，随着数据量的不断增大，如何高效地处理和分析海量数据已经成为一个重要的挑战。为了满足这一需求，Hive应运而生。 Hive作为一个基于Hadoop的数据仓库基础设施，为用户提供了类SQL的查询语言和丰富的功能，使得处理大规模数据变得更...

AIGC 2024-02-22 人工智能

827阅读

全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，重燃开源之战

一声炸雷深夜炸响，谷歌居然也开源LLM了？！这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。而且更令人印象深刻的是，还...

生成式AI 2024-02-22 人工智能

807阅读

谷歌VideoPoet负责人蒋路跳槽TikTok！对标Sora，AI视频模型大战在即

离职OpenAI的技术大神karpathy，终于上线了2小时的AI大课。 ——「让我们构建GPT Tokenizer（分词器）」。图片其实，早在新课推出两天前，karpathy在更新的GitHub项目中，就预告了这件事。图片这个项目是minbpe...

人工智能 2024-02-22 人工智能

807阅读

大语言模型之LlaMA系列-LlaMA 2及LlaMA_chat(下)

多转一致性的系统消息 - System Message for Multi-Turn Consistency 在对话设置中，某些指示应适用于所有对话轮次。例如，简洁地响应，或"充当"某个公众人物。当我们向Llama 2-Chat提供此类指示时，后...

大数据 2024-02-22 人工智能

931阅读

都在搞端到端，试问端到端自动驾驶的基石到底是什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解基础模型的出现彻底改变了自然语言处理和计算机视觉领域，为其在自动驾驶（AD）中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾，展示了基础模型在增强AD中的...

人工智能 2024-02-22 人工智能

873阅读

单GPU就能压缩模型，性能不变参数少25%！微软提出模型稀疏化新方法

众所周知，对于大语言模型来说，规模越大，所需的算力越大，自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域，即模型的稀疏化（Sparsification）。今天要介绍的SliceGPT，则可以实现模型的事后稀疏。也就是说，在一个模型训练完了以...

AIGC 2024-02-21 人工智能

846阅读

Karpathy新视频又火了：从头构建GPT Tokenizer

技术大神卡帕西离职OpenAI以后，营业可谓相当积极啊。这不，前脚新项目刚上线，后脚全新的教学视频又给大伙整出来了：这次，是手把手教咱构建一个GPT Tokenizer（分词器），还是熟悉的时长（足足2小时13分钟）。 Ps. 上次讲课还是俩月前的...

AIGC 2024-02-21 人工智能

733阅读

被字节辟谣的中文版Sora，究竟厉害在哪里？

撰稿 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）近日，市场有消息称，在Sora引爆文生视频赛道之前，国内的字节跳动也推出了一款新型视频模型Boximator，与Gen-2、Pink1.0等既有模型相比，Boximator的独特...

生成式AI 2024-02-21 人工智能

827阅读

深度学习在时间序列预测的总结和未来方向分析

2023年是大语言模型和稳定扩散的一年，时间序列领域虽然没有那么大的成就，但是却有缓慢而稳定的进展。Neurips、ICML和AAAI等会议都有transformer 结构(BasisFormer、Crossformer、Inverted transf...

生成式AI 2024-02-21 人工智能

861阅读

谷歌AI推出ScreenAI：用于UI和信息图解读的视觉语言模型

划重点: ⭐️ Google AI 团队提出了 ScreenAI，这是一个视觉语言模型，可以全面理解 UI 和信息图。 ⭐️ ScreenAI 在多个任务上表现出色，包括图形问答（QA），元素注释，摘要生成等。 ⭐️ 该团队发布了三个新数据集，为未来研究提...

生成式AI 2024-02-21 人工智能

827阅读

创作活动（九十三）———ChatGPT 和文心一言哪个更好用？

#ChatGPT 和文心一言哪个更好用？# 根据提供的搜索结果，ChatGPT和文心一言各有特点和优势，选择哪一个更好用取决于具体的应用场景和个人需求。以下是两者的对比： ChatGPT：适用场景：适合需要生成大量知识性文本的任务，如问答系统、知识图...

大数据 2024-02-21 人工智能

986阅读

逆天了！UniVision：BEV检测和Occ联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-02-21 人工智能

887阅读

详解面向 Java 开发人员的机器学习案例

译者 | 陈峻审校 | 重楼自去年以来，诸如ChatGPT 和 Bard之类的大语言模型已将机器学习提升到了一种现象级的地位。开发人员使用它们在辅助编程方面不断探索了从图像生成到疾病检测等领域的应用案例。鉴于全球各大科技公司都在加大针对机器学习的...

大数据 2024-02-21 人工智能

908阅读

英伟达NeMo框架在AI领域的综合应用与优势总结

一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架，源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...

人工智能 2024-02-21 人工智能

971阅读

基于LLaMA-Factory的微调记录

文章目录数据模型准备基于网页的简单微调基于网页的简单评测基于网页的简单聊天基于网页的模型合并微调问题测试与解决问题测试模板修改强化训练持续训练单数据集训练微调总结 LLaMA-Factory是一个非常好用的无代...

生成式AI 2024-02-21 人工智能

1908阅读

全网最全Stable Diffusion原理快速上手，模型结构、关键组件、训练预测方式！！！！

手把手教你入门绘图超强的AI绘画程序，用户只需要输入一段图片的文字描述，即可生成精美的绘画。给大家带来了全新保姆级教程资料包（文末可获取）【AIGC】Stable Diffusion的建模思想、训练预测方式快速在这篇博客中，将会用机器学习入门级描...

大数据 2024-02-21 人工智能

1078阅读

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩

耗费的计算资源仅为传统Stable Video Diffusion（SVD）模型的2/25！ AnimateLCM-SVD-xt发布，一改视频扩散模型进行重复去噪，既耗时又需大量计算的问题。先来看一波生成的动画效果。赛博朋克风轻松驾驭，男孩头戴耳机，...

大数据 2024-02-20 人工智能

883阅读

为什么人工智能应该开源？

在当今快速发展的数字时代，人工智能几乎处于所有行业革命性创新的前沿。从医疗保健、教育到娱乐，人工智能的变革性影响是显而易见的。什么是开源人工智能? 开源人工智能是人工智能软件和工具，其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访...

生成式AI 2024-02-20 人工智能

759阅读

人工智能驱动的效率：重新定义数据中心的能源使用

在当今的数字时代，数据中心是积极管理巨大信息流的动力，以保持我们互联世界的运行。数据中心格局反映了这场技术革命，其在过去三年中增长了惊人的48%。然而，这种进步是有代价的，因为大型数据中心是贪婪的能源消耗者，每个数据中心都需要足够的电力来供电。人工智...

AIGC 2024-02-20 人工智能

851阅读

AnyGPT:实现任意模态输入到任意模态输出

近日，复旦大学、上海人工智能实验室等机构联合推出了一款名为AnyGPT的多模态大语言模型，该模型在处理语音、文本、图像和音乐等多种模态输入时，可以生成任何模态的输出。 AnyGPT采用离散表示技术，通过在各模态输入上进行离散标记，实现了多模态信息的统一处...

大数据 2024-02-20 人工智能

878阅读

什么是机器学习中的模型部署？

在机器学习中，模型部署是将机器学习模型集成到现有生产环境中的过程，在该环境中，模型可以接受输入并返回输出。目标是让其他人可以使用经过训练的机器学习模型的预测。大多数在线资源侧重于机器学习生命周期的前期步骤，例如探索性数据分析(EDA 、模型选择和模型...

AIGC 2024-02-20 人工智能

815阅读

Midjourney创始人：版权问题暂时无解，AI生图不是要取代艺术家

Midjourney大火之后，艺术家的路却越走越窄了。而最近，又曝出Midjourney等生图AI面临很严重的版权问题。用户用非常简单的提示词就能获得无数收版权保护的图像。最近，福布斯杂志的特约撰稿人专门采访了Midjourney的创始人David...

人工智能 2024-02-20 人工智能

795阅读

Sora给中国AI带来的真实变化

OpenAI的最新技术成果——文生视频模型Sora，在春节假期炸裂登场，令海内外的AI从业者、投资人彻夜难眠。如果你还没有关注到这个新闻，简单介绍一下:Sora是OpenAI使用超大规模视频数据，训练出的一个通用视觉模型，可以理解和模拟运动中的物理世界，...

大数据 2024-02-20 人工智能

803阅读

生成式人工智能和数据质量可以共存吗？

在这个高科技的时代，想必大家对于生成式人工智能并不陌生，至少都有听说过。但对于人工智能所生成的数据，大家始终有所顾虑，这就不得不涉及到数据质量了。在这个高科技的时代，想必大家对于生成式人工智能并不陌生，至少都有听说过。但对于人工智能所生成的数据，大家...

生成式AI 2024-02-20 人工智能

750阅读

SIMPL：用于自动驾驶的简单高效的多智能体运动预测基准

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...

AIGC 2024-02-20 人工智能

968阅读