数据集第49页 - AIGC资讯

数据治理与大模型一体化实践

降本增效方面，以机器学习团队的构成为例，滴普科技Deepexi产品线总裁柏海峰介绍道：“传统机器学习或者说小模型的技术落地，对人才的要求很高，但企业往往没有意识到这个问题。具体来说，一般需要构建一个综合性的团队即数据科学团队，团队中需要数据开发工程师、...

AIGC 2023-12-20 人工智能

796阅读

[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark：Java大师的大数据研究之旅

作为一位Java大师，我始终追求着技术的边界，最近我将目光聚焦在大数据领域。在这个充满机遇和挑战的领域中，我深入研究了Hadoop、HDFS、Hive和Spark等关键技术。本篇博客将从"是什么"、"为什么"和"怎么办"三个角度，系统地介绍这些技术。...

AIGC 2023-12-19 人工智能

815阅读

用生物脑机制启发持续学习，让智能系统适者生存，清华朱军等团队研究登Nature子刊封面

在开放、高动态和演化环境中的学习能力是生物智能的核心要素之一，也是人类以及大多数动物在「适者生存」的自然选择过程中形成的重要优势。目前传统机器学习范式是在静态和封闭的数据集上学习到一个模型，并假设其应用环境和之前训练数据的属性相同，因而无法适应动态开放环...

AIGC 2023-12-19 人工智能

849阅读

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

代码大模型的应用及其安全性研究写在最前面一些想法大型模型输出格式不受控制的解决方法大模型介绍（很有意思）GPT 模型家族的发展 Chatgpt 优点缺点 GPT4 其他模型补充：self-instruct合成数据 Cod...

人工智能 2023-12-19 人工智能

845阅读

Gemini自曝文心一言牵出重大难题，全球陷入高质量数据荒？2024年或将枯竭

谷歌Gemini，又出丑闻了！昨天上午，网友们激动地奔走相告：Gemini承认自己是用文心一言训练中文语料的。国外大模型用中国模型产生的中文语料训练，这听起来就是个段子，结果段子竟然成现实了，简直魔幻。微博大V「阑夕」夜亲自下场，在Poe网站上实...

AIGC 2023-12-19 人工智能

776阅读

OpenAI官宣全新安全团队：模型危险分四级，董事会有权决定是否发布

今天，OpenAI连发多条推特，隆重宣布了自己的「准备框架」（Preparedness Framework）。在经历了各种大大小小的风波之后，OpenAI终于把人工智能的安全问题摆到了台面上。这套框架的目的，就是监控和管理越来越强的大模型。防止哪天...

人工智能 2023-12-19 人工智能

783阅读

丹麦 AI 模型预测死亡率准确度超保险公司，引发被滥用担忧

12 月 19 日消息，丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型，可以根据个人数据预测死亡率，准确度远超现有的任何模型，甚至包括保险业使用的模型。研究人员表示，该模型能提前预警健康和社会问题，也需要警惕其被大型企业滥用。乔...

AIGC 2023-12-19 人工智能

722阅读

大语言模型之四-LlaMA-2从模型到应用

最近开源大语言模型LlaMA-2火出圈，从huggingface的Open LLM Leaderboard开源大语言模型排行榜可以看到LlaMA-2还是非常有潜力的开源商用大语言模型之一，相比InstructGPT，LlaMA-2在数据质量、培训技术、能力...

大数据 2023-12-19 人工智能

1564阅读

谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐

谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作，提出了一种名为PixelLLM的智能模型，旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发，尤其是婴儿描述其视觉环境的方式，包括手势、指向和命名。 Pix...

生成式AI 2023-12-19 人工智能

849阅读

Hugging Face 首席执行官希望实现人工智能民主：将 AI 的力量集中在少数人手中是有风险的

Hugging Face 的首席执行官 Clément Delangue 对大型科技公司像商业专利一样保留机器学习代码的做法持反对态度。相反，他正在努力构建一个世界，在这个世界中，每个开发者或初创公司都可以自由访问人工智能模型，并有效地帮助 AI 实现开源...

人工智能 2023-12-19 人工智能

806阅读

AIGC参数量节节攀升，对存储带来的挑战如何解决？

引言近期，AIGC 相关产品如同雨后春笋一般不断涌现。但在技术层面，大家普遍的关注点更多集中在性能方面，却经常忽略了存储对推理和训练效率的影响，以及 AIGC 内容可能带来的合规风险。我们特邀腾讯云存储的产品负责人崔剑老师和益企研究院创始人、腾讯云 ...

AIGC 2023-12-19 人工智能

1111阅读

华人团队用大模型实现“读心术”：大脑活动直接变文字

NeurIPS收录的一项新研究，让大模型也学会“读心术”了！通过学习脑电波数据，模型成功地把受试者的脑电图信号翻译成了文本。而且整个过程不需要大型设备，只要一块特制的“头巾”就能实现。这项成果名为DeWave，能在不通过侵入式设备和MRI的情况下...

大数据 2023-12-18 人工智能

851阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始，多次去...

生成式AI 2023-12-18 人工智能

903阅读

word2vec作者曝与Ilya等十年积怨：seq2seq也是我的想法

里程碑式论文word2vec获得NeurIPS时间检验奖，可谓实至名归。但一作Tomas Mikolov在Facebook上发表的长篇获奖感言，却充满了失望和不满。图片论文最初被ICLR拒稿都算小事了，他还暗讽了OpenAI首席科学家Ilya Su...

大数据 2023-12-18 人工智能

836阅读

大语言模型微调数据竞赛，天翼云斩获冠军！

近日，天池FT-Data Ranker竞赛落下帷幕，天翼云智能边缘事业部AI团队（后称天翼云AI团队）凭借在大语言模型（LLM）训练数据增强方面的卓越研究，荣获大语言模型微调数据竞赛——7B模型赛道冠军。 FT-Data Ranker竞赛是一场面向大语...

大数据 2023-12-18 人工智能

776阅读

华人团队用大模型实现“读心术”：大脑活动直接变文字 | NeurIPS 2023

NeurIPS收录的一项新研究，让大模型也学会“读心术”了! 通过学习脑电波数据，模型成功地把受试者的脑电图信号翻译成了文本。而且整个过程不需要大型设备，只要一块特制的“头巾”就能实现。这项成果名为DeWave，能在不通过侵入式设备和MRI的情况下解...

AIGC 2023-12-18 人工智能

772阅读

字节自研大模型，却因用ChatGPT被封号惹争议？官方回应了

上周末，有外媒报道称，字节跳动在使用 OpenAI 技术开发自有大语言模型时，因违反 OpenAI 服务条款从而遭账号禁用。据 The Verge 报道，字节跳动内部正在研发的大语言模型项目名为「种子计划」（Project Seed）。由于训练大模型...

AIGC 2023-12-18 人工智能

846阅读

大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型

图1.1 GPT-2 模型结构关于训练集，其来源都是公开数据集，无任何定制数据集，保证了其工作与开源兼容和可复现。整个训练数据集在 token 化之后大约包含 1.4T 的 token。其中，LLaMA-65B 和 LLaMA-33B 是在 1.4万亿...

AIGC 2023-12-18 人工智能

937阅读

速度暴涨1000倍！扩散模型预测材料“炼金”过程，体系越复杂加速度越大

用扩散模型预测化学反应，速度直接暴涨1000倍！原本需要用计算机硬算几小时甚至一天，现在单个GPU用6秒钟就能搞定。这是MIT和康奈尔大学联合搞出来的一项新研究，用扩散模型来预测化学反应中最关键的过渡态结构，不仅计算速度提升1000倍，结果也竟然意想...

生成式AI 2023-12-18 人工智能

793阅读

为AIGC敲响警钟！千亿级赛道为何成了作恶温床？

‍数据智能产业创新服务媒体 ——聚焦数智 · 改变商业随着人工智能通用大模型的问世，全球对AIGC技术的强大潜力有了更加深刻的认识。然而，这也引发了诸多关于AIGC技术可信度、隐私保护以及知识产权等问题的争议，引起了广泛...

大数据 2023-12-18 人工智能

740阅读

openAI灰度测试GPT4.5 实现六大能力增强

近日，有消息称OpenAI 正在灰度测试最新模型GPT4.5turbo，而宝玉、歸藏等博主也纷纷表示自己的版本已经更新到GPT4.5。据GPT4.5turbo问答结果显示，相较于之前的GPT-4-turbo，新模型在多个方面实现了六大能力的增强。首先，...

人工智能 2023-12-18 人工智能

783阅读

详解生成对抗网络（GAN）- 体验AI作画

目录 1.GAN是什么？ 2.GAN的计算 3.编写GAN的小小示例 4.GAN的发展与应用 5.AI作画体验-Disco Diffusion 1.GAN是什么？ 2014年，因为朋友邀请协助一个计算机生成图像的项目，lanGoodd...

人工智能 2023-12-18 人工智能

953阅读

MidJourney v5.2 、Stable Diffusion XL 0.9 出图对比

最近两个最流行的AI图像生成器，Midjourney和Stable Diffusion，都发布了重大更新。Midjourney v5.2引入了许多新功能，包括“缩小”功能、“/缩短”命令、改进的图像质量等。 Stable Diffusion XL (SD...

人工智能 2023-12-18 人工智能

864阅读

AIGC专题报告：ChatGPT纪要分享

今天分享的AIGC系列深度研究报告：《AIGC专题报告：ChatGPT纪要分享》。（报告出品方：久谦中台）报告共计：135页 OpenAI 高管解密 ChatGPT ¶ GPT-3 是一种大型语言模型，被训练用来在给定上下文中预测下...

人工智能 2023-12-17 人工智能

879阅读

基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化

? 宝子们可以戳阅读原文查看文中所有的外部链接哟！基于隐空间的扩散模型 (Latent Diffusion Model ，是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例，广泛应用在商业和工...

人工智能 2023-12-17 人工智能

869阅读

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

给你一首曲子的音频和一件乐器的 3D 模型，然后问你这件乐器能否演奏出这首曲子。你可以通过听觉来辨认这首曲子的音色，看它是钢琴曲还是小提琴曲又或是来自吉他；同时用视觉识别那是件什么乐器。然后你就能得到问题的答案。但语言模型有能力办到这一点吗？实际上，...

大数据 2023-12-17 人工智能

818阅读

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

Hugging Face 技术负责人 Philipp Schmid 表示：“代码自动补全工具，如 GitHub Copilot，已被超过一百万开发者使用，帮助他们的编码速度提高了 55%。看到像 Magicoder 和 OSS-INSTRUCT 这样的开...

AIGC 2023-12-17 人工智能

958阅读

【文生图】Stable Diffusion XL 1.0模型Full Fine-tuning指南（U-Net全参微调）

文章目录前言重要教程链接以海报生成微调为例总体流程数据获取 POSTER-TEXT AutoPoster CGL-Dataset PKU PosterLayout PosterT80K Movie & TV Series...

大数据 2023-12-17 人工智能

951阅读

Mistral携微软引爆「小语言模型」潮！Mistral中杯代码能力完胜GPT-4，成本暴降2/3

最近，「小语言模型」忽然成为热点。本周一，刚刚完成4.15亿美元融资的法国AI初创公司Mistral，发布了Mixtral 8x7B模型。这个开源模型尽管尺寸不大，小到足以在一台内存100GB以上的电脑上运行，然而在某些基准测试中却能和GPT-3....

人工智能 2023-12-17 人工智能

788阅读

AI绘画 | stable-diffusion的模型简介和下载使用

前言我们下载完stable-diffusion-ui后还需要下载需要的大模型，才能进行AI绘画的操作。秋叶的stable-diffusion-ui整合包内，包含了anything-v5-PrtRE.safetensors和Stable Diffusi...

人工智能 2023-12-17 人工智能

2363阅读

【Google Bard】公测已开始，与文心一言、chatGPT相比如何？

一、Google Bard简介自从2022年11月30日，openAI开放聊天机器人chatGPT之后，其热度一直居高不下。 openAI公司成立于2015年，成立后不久，微软就对其工作给予了大力支持，包括资金援助、以及提供高性能服务器。在这些...

AIGC 2023-12-17 人工智能

805阅读

最强文生图跨模态大模型：Stable Diffusion

文章目录一、概述二、Stable Diffusion v1 & v2 2.1 简介 2.2 LAION-5B数据集 2.3 CLIP条件控制模型 2.4 模型训练三、Stable Diffusion 发展 3.1 图形界面...

大数据 2023-12-17 人工智能

1741阅读

AIGC系列之：CLIP和OpenCLIP

目录模型背景 CLIP模型介绍相关资料原理和方法 Image Encoder Text Encoder 对比学习预训练 Zero Shot预测优势和劣势总结 OpenClip模型介绍相关资料原理结果用法...

人工智能 2023-12-17 人工智能

3076阅读

在矩池云运行 Stable Diffusion web UI，使用v1.5模型和 ControlNet 插件

今天给大家介绍下如何在矩池云使用 Stable Diffusion web UI v1.5 模型和 Stable Diffusion ControlNet 插件。租用机器租用机器需要选择内存大于8G的机器，比如 A2000，不然 Stable D...

生成式AI 2023-12-16 人工智能

791阅读

Stable Diffusion 绘画初探 chilloutmix模型人物画像首选

AI绘画发展以来出现了很多优质的平台，Stable Diffusion是普通大众最爱的之一，比起MJ来讲，它是现在愿意动手的人的首选，在这里要首先感谢GITHUB上的一众开源大佬。 AI绘画首先吸引大家的不用说了，肯定是那些看起来美若天仙的小姐姐。无论二...

AIGC 2023-12-16 人工智能

937阅读

下一代自动驾驶系统，少不了大模型，系统调研来了

随着大语言模型 (LLM 和视觉基础模型 (VFM 的出现，受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里，LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力，但其在驾驶系统中的关键挑战...

生成式AI 2023-12-16 人工智能

859阅读

论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models

论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models 1. 文章简介 2. 文章概括 3 文章重点技术 3.1 预训练Pretraining 3.1.1 预训练细节 3.1.2...

AIGC 2023-12-16 人工智能

1013阅读

LLM - Chinese-Llama-2-7b 初体验

目录一.引言二.模型下载三.快速测试四.训练数据五.总结一.引言自打 LLama-2 发布后就一直在等大佬们发布 LLama-2 的适配中文版，也是这几天蹲到了一版由 LinkSoul 发布的 Chinese-Llam...

生成式AI 2023-12-16 人工智能

916阅读

UC伯克利DeepMind等联合发布真实世界模拟器，打破虚实边界

真实世界模拟器来啦！还在发愁训练出的大模型无法适应真实的物理世界吗？ AI Agent想要进入我们的生活还有多远的距离？ ——UC伯克利、谷歌DeepMind、MIT和阿尔伯塔大学的研究人员告诉你答案。在NeurlPS 2023上，研究人员将展示他们...

AIGC 2023-12-16 人工智能

1069阅读

AIGC 场景下存储与数据管理的挑战与应对

10月28日，"寻宝 AI 时代——OSC 源创会苏州站暨 Techo TVP 技术沙龙"在苏州圆满落幕。腾讯云存储专家解决方案架构师屠伟新带来《AIGC 场景下存储与数据管理的挑战与应对》主题分享。下面我们一起来学习回顾一下AIGC场景下的存储解决方案。...

大数据 2023-12-16 人工智能

878阅读

【文心一言】使用飞桨 AI Studio 快速搭建，看图识猜成语应用

目录一、背景二、实践三、创建应用 3.1、零代码开发 3.2、应用名称 3.2、模型训练 3.3、开始训练四、应用部署 4.1、发布项目 4.2、搜索应用 4.3、应用部署 4.4、获取令牌 4.4、导入依赖 4.5、配置CO...

大数据 2023-12-15 人工智能

1194阅读

Imagen2官网体验入口谷歌AI文生图软件app免费下载地址

Imagen2 是Google DeepMind开发的最先进的文本到图像扩散技术产品，可生成高品质、逼真的图像，与用户的文字提示紧密对齐。这款技术利用其训练数据的自然分布生成更逼真的图像，而不是采用预设的风格。开发者和Cloud客户可以通过Google C...

人工智能 2023-12-15 人工智能

968阅读

真实、可控、可拓展，自动驾驶光照仿真平台LightSim上新了

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

AIGC 2023-12-15 人工智能

1013阅读

人工智能中的文本分类：技术突破与实战指导

在本文中，我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用，以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用，旨在提供对文本分类技术深入理解的全面视角。关注TechLead，分享A...

生成式AI 2023-12-15 人工智能

948阅读

谁能更好地检测深度伪造？人还是机器？

译者 | 陈峻审校 | 重楼不知您是否听说过深度伪造（Deepfakes）这种欺诈应用？由它产生的各种虚假信息已威胁到了人类社会的方方面面。随着人工智能技术的进步，我们亟待提升识别虚假内容的能力。那么在实际检测假新闻可信度等用例时，到底是人类还是机器...

AIGC 2023-12-15 人工智能

935阅读

人工智能改变牙科服务的六大趋势

难道已经有机器人牙医了吗？还没有……。但是，牙科诊所已经加快了将新兴技术融入常规诊疗的步伐。人工智能也不例外。事实上，人工智能正在显著改变牙科行业，牙科行业提供的一系列创新技术正在改善患者护理和提高诊断准确性及运营效率。我们已经看到了以下的六大趋势。...

生成式AI 2023-12-15 人工智能

1187阅读

如何训练一个简单的stable diffusion模型(附详细注释）

注：代码来自https://github.com/darcula1993/diffusion-models-class-CN/blob/main/unit1/01_introduction_to_diffusers_CN.ipynb 本文是本人学习后的...

大数据 2023-12-15 人工智能

1175阅读

QTNet：最新时序融合新方案！点云、图像、多模态检测器全适用（NeurIPS 2023）

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 & 个人理解时序融合能够有效提升自动驾驶3D目标检测的感知能力，然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章《Qu...

大数据 2023-12-15 人工智能

1074阅读

What the DAAM: Interpreting Stable Diffusion Using Cross Attention

What the DAAM: Interpreting Stable Diffusion Using Cross Attention (Paper reading Raphael Tang, Comcast Applied AI, ACL2023 b...

大数据 2023-12-15 人工智能

979阅读

扩散模型训练太难？来看看Meta AI最新提出的KNN-Diffusion

原文链接：https://www.techbeat.net/article-info?id=4323 作者：seven_ 最近AIGC社区中有趣的工作可谓是层出不穷，这都得益于扩散模型（Diffusion Models）的成功，扩散模型作为生成式AI...

大数据 2023-12-14 人工智能

886阅读