数据集第55页 - AIGC资讯

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta，这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中，大语言模型并不一定就是最优的解决...

AIGC 2023-11-27 人工智能

811阅读

【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型

文章目录一、背景二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择三、效果四、思考论文：Learning Transferabl...

AIGC 2023-11-27 人工智能

2226阅读

网络规模、训练学习速度提升，清华团队在大规模光电智能计算方向取得进展

随着大模型等人工智能技术的突破与发展，算法复杂度剧增，对传统计算芯片带来了算力和功耗的双重挑战。近年来，以光计算为基础、通过光电融合的方式构建光电神经网络的计算处理方法已经成为国际热点研究问题，有望实现计算性能的颠覆性提升。然而，光电神经网络的前向数学...

大数据 2023-11-27 人工智能

756阅读

更像人脑的新型注意力机制，Meta让大模型自动屏蔽任务无关信息，准确率提高27%

关于大模型注意力机制，Meta又有了一项新研究。通过调整模型注意力，屏蔽无关信息的干扰，新的机制让大模型准确率进一步提升。而且这种机制不需要微调或训练，只靠Prompt就能让大模型的准确率上升27%。作者把这种注意力机制命名为“System 2...

生成式AI 2023-11-27 人工智能

722阅读

Inflection推Inflection-2：号称全球计算级别最佳AI模型及全球第二最强大LLM

Inflection AI最近推出的语言模型Inflection-2，被宣称为全球计算级别最佳的AI模型，位列全球第二最强大的大型语言模型（LLM），仅次于OpenAI的最新模型。这一创新的AI模型的开发是为了满足对能够在各种任务中理解和生成类似人类文本的...

大数据 2023-11-27 人工智能

720阅读

大火的4D Radar开源数据汇总

本文经自动驾驶之心公众号授权转载，转载请联系出处。 4D Radar在自动驾驶领域中越来越受关注，在价格和功能上都有比较大的竞争力，相关研究也逐渐open，今天为大家盘点下开源的4D Radar数据，为相关科学研究提供保障！ 1Astyx 数据集链接：h...

人工智能 2023-11-27 人工智能

1071阅读

Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享

OVD技术简介目标检测是计算机视觉领域中的一项核心任务，其主要目标是让计算机能够自动识别图片中目标的类别，并准确标示每个目标的位置。目前，主流的目标检测方法主要针对闭集目标的开发，即在任务开始之前需要对待检测目标进行类别定义，并进行人工数据标注，通...

大数据 2023-11-27 人工智能

1465阅读

LLMs之Code：大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等)及其评估

LLMs之Code：大语言模型纵向赋能场景—垂直行业场景应用之大模型代码场景的简介、主流LLMs(SQLCoder/Code Llama/Ziya-Coding/CodeShell等及其评估基准(包括数据集、案例应用之详细攻略目录大模...

AIGC 2023-11-27 人工智能

785阅读

本地免费GPT4？Llama 2开源大模型，一键部署且无需硬件要求教程

目前扎克布格带来了最新的Llama 2开源NLP大模型，目前有三个版本分别是70亿参数量，130亿参数量和700亿参数量，庞大的数据集和参数量保证了模型的强大，官网宣称性能与gpt4相比不落下风，又因为开源使得我们可以实现本地化gpt4的梦...

AIGC 2023-11-27 人工智能

846阅读

使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理

前几天，Meta 发布了 LIMA 大模型，在LLaMA-65B的基础上，无需使用 RLHF，只用了 1000 个精心准备的样本数据进行微调，就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。之前的一系列大模型相...

生成式AI 2023-11-27 人工智能

883阅读

AI生成内容（AIGC）：概念、实现与未来趋势

一、AIGC的基本概念 AI生成内容（AIGC），是指运用人工智能技术，尤其是深度学习技术，创建各类数字内容的新型内容创作模式。AIGC继承了专业生成内容（PGC）的高质量特点，再结合用户生成内容（UGC）的分布式、互动的特点，打造了全新的数字内容生成与...

人工智能 2023-11-27 人工智能

1183阅读

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...

AIGC 2023-11-27 人工智能

1467阅读

视频生成: 基于Stable Diffusion的微调方法

chatGPT带来了几个月的AIGC热度，文本图像生成模型大行其道，但AI在视频生成任务上尚没有较好的开源仓库，并受限于“缺那么几百块A100"的资源问题，大多数人无法展开视频生成的研究。好在目前有不少针对视频生成的相关paper，也有不少开源实现...

AIGC 2023-11-26 人工智能

998阅读

南开&山大&北理工团队开发trRosettaRNA：利用Transformer网络自动预测RNA 3D结构

RNA 3D 结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发，南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA，这是一种基于深度学习的自动化 RNA 3D 结构预测方法。 trRosettaRNA 流程包括...

大数据 2023-11-26 人工智能

855阅读

自驱力超强的羊驼？斯坦福微调LLaMa

大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力，但严重依赖于人类编写的指令数据，而这些数据在数量、多样性和创造性方面都是有限的。斯坦福科研人员引入了self-instruction框架，提高指令遵循能力来自我迭代进化，与Instr...

大数据 2023-11-26 人工智能

891阅读

六个常用的聚类评价指标

评估聚类结果的有效性，即聚类评估或验证，对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类，还可以用来确定哪种聚类算法最适合特定的数据集和任务，并调优这些算法的超参数(例如k-means中的聚类数量，或DBSCAN中的密度参数 ...

人工智能 2023-11-26 人工智能

886阅读

如何本地部署基于stable-diffusion的AI绘画（jupyter，python实现，详细，附代码）

基于stable - diffusion 的本地部署AI绘画教程自从Stable Diffusion 1.0模型发布以来，“AI文本图片生成”真正的变成普通人也能使用的技术。同时各种国内外AI绘图软件，也不断频繁更新，AI绘画的关注度也越来越高...

AIGC 2023-11-26 人工智能

1180阅读

GPT成熟之路官方笔记 | OpenAI开发者日

ChatGPT产品打造的细节，现在OpenAI自己交了个底。并且这波干货分享真是信息量满满，包括但不限于： ChatGPT背后的产品和研发团队如何协作大模型应用如何从原型走向成熟 OpenAI如何优化大模型性能…… 以上信息，依然来自今年的新晋...

人工智能 2023-11-26 人工智能

818阅读

比「让我们一步一步思考」这句咒语还管用，提示工程正在被改进

大型语言模型（LLM）已经是许多自然语言处理任务的强大工具，只要能给出正确的提示。然而，由于模型的敏感性，找到最优提示通常需要进行大量手动尝试和试错努力。此外，一旦将初始提示部署到生产环境中，可能会出现意想不到的边缘情况，需要更多轮的手动调整来进一步完善...

生成式AI 2023-11-26 人工智能

837阅读

预测token速度翻番！Transformer新解码算法火了，来自小羊驼团队

小羊驼团队的新研究火了。他们开发了一种新的解码算法，可以让模型预测100个token数的速度提高1.5-2.3倍，进而加速LLM推理。比如这是同一个模型（LLaMa-2-Chat 7B）面对同一个用户提问（苏格拉底采用了哪些方法来挑战他那个时代的主...

人工智能 2023-11-26 人工智能

878阅读

「GPT-4只是在压缩数据」，马毅团队造出白盒Transformer，可解释的大模型要来了吗？

RNA3D 结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发，南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA，这是一种基于深度学习的自动化 RNA3D 结构预测方法。 trRosettaRNA 流程包括两个主...

AIGC 2023-11-26 人工智能

869阅读

人工智能生成内容（AIGC）：概念、发展历史及其机遇、挑战与未来方向

人工智能生成内容（AIGC）：概念、发展历史及其机遇、挑战与未来方向作者：阿水AI 随着人工智能技术的飞速发展，人工智能生成内容（Artificial Intelligence Generated Content, AIGC）逐渐成为了一个备受关注...

人工智能 2023-11-26 人工智能

956阅读

每日学术速递1.30

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理更多Ai资讯：今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...

生成式AI 2023-11-26 人工智能

802阅读

新AI框架HyperHuman：用于生成具有潜在结构扩散的超真实人类

近日，一项名为HyperHuman的新型人工智能框架正式亮相，为生成超逼真人体图像开创了崭新纪元。这一框架的重要突破在于结合了结构扩散技术，成功克服了以往模型在生成人体图像中面临的种种挑战。用户无需专业技能，只需提供文本和姿势等条件，HyperHuman...

AIGC 2023-11-26 人工智能

857阅读

大模型界的“熊猫烧香”，可对文生图模型造成巨大伤害！

《麻省理工技术评论》分享了一个名为Nightshade的投毒工具，可以对DALL-E、Midjourney 和Stable Diffusion等文生图模型的训练数据造成造成巨大伤害，以帮助艺术家们防止非法爬取其画作数据，用于大模型训练，同时揭露了模型存在的...

生成式AI 2023-11-26 人工智能

998阅读

基于Stable Diffusion的图像合成数据集

当前从文本输入生成合成图像的模型不仅能够生成非常逼真的照片，而且还能够处理大量不同的对象。在论文“评估使用稳定扩散生成的合成图像数据集”中，我们使用“稳定扩散”模型来研究哪些对象和类型表现得如此逼真，以便后续图像分类正确地分配它们。这使我们能够根据现实...

生成式AI 2023-11-26 人工智能

1005阅读

创造之境：Stable Diffusion + chatGPT下的自动绘图探索

什么是Stable Diffusion Stable Diffusion 是在2022年发布的深度学习文本到图像生成模型。它主要用于根据文字的描述生成详细图像，尽管它也可以应用于其他任务，如内插绘制、外插绘制，以及在提示词（英语）指导下生成图生成图的翻...

人工智能 2023-11-26 人工智能

773阅读

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件)—模型训练前置工作(参数解析+配置日志)→模型初始化(检测是否存在训练过的che

LLMs之Chinese-LLaMA-Alpaca-2：源码解读(run_clm_sft_with_peft.py文件 —模型训练前置工作(参数解析+配置日志 →模型初始化(检测是否存在训练过的checkpoint+加载预训练模型和tokenizer →数...

大数据 2023-11-26 人工智能

911阅读

Llama2通过llama.cpp模型量化 Windows&Linux本地部署

Llama2通过llama.cpp模型量化 Windows&Linux本地部署什么是LLaMA 1 and 2 LLaMA，它是一组基础语言模型，参数范围从7B到65B。在数万亿的tokens上训练的模型，并表明可以专门使用公开可用的数据...

生成式AI 2023-11-25 人工智能

1380阅读

谷歌google bard vs chatgpt给我的最大感受，速度真快，注册简单，多种答案提供。。。

上一篇写了注册百度和Google，最后还是谷歌的速度战胜了，最终在长达3天的等待中得到了拿到了测试名额。成功注册bard后，映入眼帘的就是提示下面的话，我做了翻译： Bard is an experiment As you try Bard, pl...

人工智能 2023-11-25 人工智能

1087阅读

Stable Diffusion：使用自己的数据集微调训练LoRA模型

Stable Diffusion：使用自己的数据集微调训练LoRA模型前言前提条件相关介绍微调训练LoRA模型下载kohya_ss项目安装kohya_ss项目运行kohya_ss项目准备数据集生成关键词模型参数设置预训...

生成式AI 2023-11-25 人工智能

1239阅读

大模型之Bloom&LLAMA----Pre-Training(二次预训练)

0. 简介随着chatgpt的爆火，最近也有很多大模型在不断地出现，比如说Bloom系列以及以LLAMA为基础的ziya和baichuan。这些模型相较于chatglm来说，更加具有发展前景，因为其是完全可商用，并可以不断迭代更新的。最近作者在跟着h...

生成式AI 2023-11-25 人工智能

1024阅读

人类考92分的题，GPT-4只能考15分：测试一升级，大模型全都现原形了

AutoGPT 的得分也凉凉。 GPT-4自诞生以来一直是位「优等生」，在各种考试（基准）中都能得高分。但现在，它在一份新的测试中只拿到了15分，而人类能拿92。这套名叫「GAIA」的测试题由来自 Meta-FAIR、Meta-GenAI、Hugging...

AIGC 2023-11-25 人工智能

915阅读

OpenAI神秘Q毁灭人类？爆火「Q假说」竟牵出世界模型，全网AI大佬长文热议

Q* 【新智元导读】传闻中OpenAI的Q*，已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文，猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI，已是临门一脚了? Ope...

人工智能 2023-11-25 人工智能

792阅读

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架)的简介、安装、案例实战应用之详细攻略

LLMs：Chinese-LLaMA-Alpaca-2(基于deepspeed框架的简介、安装、案例实战应用之详细攻略导读：2023年07月31日，哈工大讯飞联合实验室，发布Chinese-LLaMA-Alpaca-2，本项目基于Meta发布的...

大数据 2023-11-25 人工智能

1382阅读

【网安AIGC专题11.1】11 Coreset-C 主动学习：特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)

Active Code Learning: Benchmarking Sample-Efficient Training of Code Models 写在最前面论文名片先验知识的补充主动学习采样函数 benchmark基准和base...

大数据 2023-11-25 人工智能

972阅读

Meta AI研究团队新AI模型： Llama 2 大语言模型

Llama是Facebook Research团队开发的基础语言模型集，旨在提供广泛的语言理解能力。它基于转换器架构，参数范围从7B到65B。通过使用Llama模型，研究人员和开发人员可以构建更先进的自然语言处理系统。您可以在GitHub上找到相关的代...

人工智能 2023-11-25 人工智能

901阅读

AIGC数据处理与存储解决方案

针对在AIGC的场景下，如何解决在AIGC训练过程中数据的存储和数据处理的问题，杨冠军从三个方面进行介绍与解读：一是AIGC对存储提的新需求；二是介绍腾讯云可以给用户提供的整体存储解决方案； ...

大数据 2023-11-25 人工智能

960阅读

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。导入库...

生成式AI 2023-11-25 人工智能

761阅读

如何创建 LoRA 并应用到 Stable Diffusion WebUI 里

本着觉知此事要躬行的态度，笔者没有去看任何国内的教程，依靠着纯粹在 Github 上翻阅原版代码仓库，找到了解决方案准备数据集 LoRA 的特点就是几张图就够，并且不需要复杂的文本注释。所以，你的数据集，就是一堆散装照片，缩放到正确的尺寸 (5...

AIGC 2023-11-25 人工智能

1551阅读

【多模态】4、Chinese CLIP | 专为中文图文匹配设计

文章目录一、背景二、方法 2.1 基础内容 2.2 数据集 2.3 预训练方法 2.4 模型尺寸三、效果四、代码 4.1 推理论文：Chinese CLIP: Contrastive Vision-Language Pr...

人工智能 2023-11-24 人工智能

2426阅读

Stable Diffusion — ControlNet 超详细讲解

Stable Diffusion — ControlNet 超详细讲解 ControlNet 最近非常火?！ControlNet 和 Stable Diffusion 的结合使 Stable Diffusion 能够接受指导图像生成过程的条件输入，从而增...

AIGC 2023-11-24 人工智能

2253阅读

PBT集团表示，数据质量对训练ChatGPT至关重要

距离OpenAI向公众发布ChatGPT已经接近一年，其采纳率呈现了前所未有的飙升。截至2023年2月，据路透社报道，ChatGPT拥有大约1亿活跃用户。快进到9月，ChatGPT网站吸引了近15亿访问者，展示了该平台在当今数字领域中的巨大流行和重要作用。...

大数据 2023-11-24 人工智能

832阅读

LLaMA-2论文阅读

1. 基本介绍 LLaMA-2是2023年7月24日Meta发布的LLaMA第二代，跟LLaMA-1几个显著区别: 免费可商用版本的大模型 context上下文增加了一倍，从2K变为了4K 训练的总token数从1.0T/1.4T增加为2.0T(...

生成式AI 2023-11-24 人工智能

1129阅读

研究显示 ChatGPT 可为科学假说生成虚假数据集，对学术诚信造成威胁

11 月 24 日消息，据《自然》杂志当地时间周三报道，本月初发表在《美国医学会眼科学杂志》上的一篇论文中，作者使用了聊天机器人 GPT-4 和高级数据分析工具 ADA 创建了一个虚假的临床试验数据集，从而支持一个“未经证实”的科学主张。 IT之家注：...

AIGC 2023-11-24 人工智能

743阅读

whisper语音识别部署及WER评价

1.whisper部署详细过程可以参照：? 创建项目文件夹 mkdir whisper cd whisper conda创建虚拟环境 conda create -n py310 python=3.10 -c conda-forge...

生成式AI 2023-11-24 人工智能

1222阅读

视频生成新突破：PixelDance，轻松呈现复杂动作与炫酷特效

最近，除了大语言模型继续持续刷屏，视频生成技术也取得了重大进展，多家公司相继发布了新模型。首先，作为最早探索视频生成领域的领头羊之一，Runway 升级了其 Gen-2 模型，带来了电影级别的高清晰度，令人瞩目，并称视频生成的一致性得到了重大改进。但...

生成式AI 2023-11-24 人工智能

937阅读

Hugging Face最受欢迎15大AI机构出炉！清华第五，OpenAI第十，冠军竟是它？

【新智元导读】Hugging Face作为开源AI社区的代表，总结了社区最欢迎的前15个公司和机构。让我们看看在开源社区眼里，哪些机构对于开源AI贡献最大。 Hugging Face上最受欢迎的15个AI公司出炉了! 目前的冠军，是Stability AI...

生成式AI 2023-11-24 人工智能

889阅读

OpenAI神秘新模型Q*曝光，太强大让董事会警惕，或是奥特曼被开除导火索

OpenAI宫斗大戏刚刚落幕，马上又掀起另一场轩然大波！路透社曝光，在奥特曼被解雇之前，几位研究人员给董事会写的警告信可能是整个事件导火索：内部名为Q （发音为Q-Star）*的下一代AI模型，过于强大和先进，可能会威胁人类。 Q*正是由这场风暴的中...

AIGC 2023-11-24 人工智能

715阅读

美国空军部首席数据和AI官谈领先的AI运营和战略优势

AI正在改变我们几乎做每件事的方式，包括美国如何打仗、监控威胁和维护国防。AI的作用对军事战略和能力至关重要，以至于美国空军和太空部队今年任命了第一位首席AI官。今年春季，美国空军部（DAF）任命Eileen Vidrine为首席数据和AI官。在接受任...

生成式AI 2023-11-24 人工智能

811阅读