数据集第6页 - AIGC资讯

数据共享协议模板更新：规范数据使用行为

标题：数据共享协议模板更新：规范数据使用行为以促进合作与信任随着信息技术的飞速发展，数据已成为推动社会进步和经济发展的关键要素。数据共享作为促进创新、优化资源配置、提升决策效率的重要手段，其重要性日益凸显。然而，数据共享过程中涉及的数据安全、隐私保护及合规...

人工智能 2025-06-07 大数据

514阅读

数据预测分析模型选型建议：根据数据特点选择

在数据驱动的决策时代，数据预测分析已成为企业提升竞争力、优化运营策略的关键手段。构建一个高效的数据预测分析模型，不仅能够揭示数据背后的隐藏规律，还能为企业未来决策提供科学依据。然而，模型选型并非一成不变，它高度依赖于数据的特性、业务需求及可用资源。本文旨在...

大数据 2025-06-07 大数据

521阅读

数据清洗工具性能优化建议更新：提升处理效率

标题：数据清洗工具性能优化策略：提升处理效率的关键更新在大数据时代，数据清洗是数据分析与机器学习项目中不可或缺的一环。高效、准确的数据清洗能够显著提升后续数据处理的效率与质量。然而，随着数据量的爆炸性增长，传统数据清洗工具在处理大规模数据集时常面临性能瓶颈...

AIGC 2025-06-07 大数据

589阅读

数据标注平台创新应用案例更新：提升标注效率

标题：数据标注平台创新应用案例：提升标注效率的前沿实践随着人工智能技术的飞速发展，数据标注作为机器学习模型训练不可或缺的一环，其重要性与日俱增。高效、准确的数据标注不仅能够加速模型迭代，还能显著提升AI应用的性能与用户体验。近年来，数据标注平台通过一系列创...

人工智能 2025-06-07 大数据

655阅读

数据集成方案选型指南终极版：考虑性能与可扩展性

数据集成方案选型指南终极版：考虑性能与可扩展性在当今数字化时代，数据已成为企业最宝贵的资产之一。为了充分利用这些数据，企业需要一个高效、可靠且可扩展的数据集成方案。数据集成是指将来自不同来源、格式和结构的数据整合到一个统一的数据存储或数据湖中的过程。这不仅...

AIGC 2025-06-07 大数据

486阅读

数据集成方案性能评估报告更新：根据需求定制

标题：数据集成方案性能评估报告更新：根据需求定制的策略与实践一、引言在数字化转型的浪潮中，数据集成作为连接企业内部各个信息系统、实现数据流通与共享的关键环节，其性能直接影响到企业数据治理的效率与质量。随着业务需求的不断演变和技术架构的持续升级，数据集成方案...

AIGC 2025-06-06 大数据

440阅读

数据可视化设计软件选型指南更新：提升图表制作效率

数据可视化设计软件选型指南更新：提升图表制作效率在当今信息爆炸的时代，数据可视化已成为各行各业中不可或缺的一部分。无论是企业决策、学术研究还是新闻报道，数据可视化都能帮助人们更快地理解复杂信息，把握数据背后的趋势和规律。然而，要想制作出既美观又富有洞察力的...

AIGC 2025-06-06 大数据

541阅读

数据预测分析模型性能优化：提升预测效果

数据预测分析模型的性能优化：提升预测效果在当今数字化时代，数据预测分析已成为企业决策过程中的关键工具。通过构建精准的预测模型，企业能够洞察市场趋势、优化运营策略，并提前规避潜在风险。然而，预测模型的性能并非一成不变，它受到多种因素的影响，包括数据质量、模型...

大数据 2025-06-06 大数据

449阅读

数据预测分析模型选型指南：根据数据特点选择

标题：数据预测分析模型选型指南：精准匹配数据特性的决策框架在当今数据驱动的时代，预测分析已成为企业决策的重要工具。通过对历史数据的深入挖掘与模式识别，预测分析能够帮助组织预见未来趋势，优化资源配置，提升运营效率。然而，成功的预测分析高度依赖于选择合适的模型...

生成式AI 2025-06-06 大数据

496阅读

数据集成方案应用案例终极版：打破数据壁垒

标题：数据集成方案应用案例终极版：打破数据壁垒，重塑业务价值在当今这个数据驱动的时代，信息的价值不言而喻。然而，随着企业规模的扩大和业务多元化，数据孤岛和数据壁垒成为了制约企业发展的重要瓶颈。为了充分利用数据资产，提升决策效率与精准度，数据集成方案应运而生...

大数据 2025-06-06 大数据

486阅读

数据集成方案应用案例分享：打破数据壁垒

标题：数据集成方案应用案例分享：打破数据壁垒，驱动业务创新在当今这个数据驱动的时代，企业对于数据的依赖日益加深。然而，数据孤岛、系统不兼容、数据格式不统一等问题，如同一道道无形的壁垒，阻碍了数据价值的最大化利用。为了打破这些壁垒，实现数据的无缝流通与高效利...

大数据 2025-06-06 大数据

489阅读

数据标注平台创新应用：提升标注效率

标题：数据标注平台创新应用：驱动标注效率的新飞跃在人工智能日新月异的今天，数据作为AI模型的“燃料”，其质量与数量直接决定了智能系统的性能上限。而数据标注，作为将数据转化为机器学习可识别信息的关键环节，其效率与质量对AI应用的发展至关重要。近年来，数据标注...

AIGC 2025-06-06 大数据

555阅读

数据集成挑战应对策略：打破数据壁垒

标题：数据集成挑战应对策略：打破数据壁垒，构建无缝信息生态在当今数字化时代，数据已成为企业决策与运营的核心驱动力。然而，随着数据来源的多样化、格式的复杂化以及存储位置的分散化，数据集成成为了一个复杂而关键的任务。数据集成不仅仅是将不同来源的数据合并到一个统...

大数据 2025-06-06 大数据

431阅读

RWKV-7 预览版、大量新论文...RWKV 社区 9 月动态速览

欢迎大家收看《RWKV 社区最新动态》第五期，本期内容收录了 RWKV 社区 2024 年 9 月的最新动态。 9 月动态省流版（TL;DR） RWKV 官方新闻动态 RWKV-7 发布预览版 RWKV-7 论文撰写已面向社区开放...

生成式AI 2024-10-13 人工智能

2463阅读

大模型存储选型 & JuiceFS 在关键环节性能详解

从去年开始，LLM大语言模型领域发展迅速、如 LLaMA、ChatGLM、Baichuan、Qwen 和 yi-model 等基础模型（Foundation Models）的数量显著增加。众多企业也开始基于这些基础模型做 post-training 的相关...

生成式AI 2024-10-12 人工智能

1549阅读

大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲

LLaMA-Factory ——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型，并且提供了丰富的训练算法，包括增量预训练、多模态指令监督微调、奖励模型训练等。 LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写...

大数据 2024-10-06 人工智能

1374阅读

Llama 3.1大模型的预训练和后训练范式解析

Meta的Llama大型语言模型每次出新版本，都会是一大事件。前段时间他们不仅发布了3.1的一个超大型的405亿参数模型，还对之前的8亿和70亿参数的模型做了升级，让它们在MMLU测试中的表现更好了。不同模型在MMLU基准测试中的表现他们还...

人工智能 2024-10-06 人工智能

1305阅读

亚马逊云科技Code Whisperer如何提高理解数据结构与算法的效率

关键字: [Code Whisperer, Data Structures Arrays, Sorting Algorithms, Merge Sort, Array Implementation, Coding Interviews] 导读...

大数据 2024-10-06 人工智能

1073阅读

Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向Task2笔记

Datawhale X 魔搭 AI夏令营第四期-AIGC文生图方向-Task2：精读代码，实战进阶 Task2任务目标 AI工具使用 AI工具介绍 ChatGPT 功能与用途优点缺点总结 KIMI 通义千问主要功能与用途：优点：...

AIGC 2024-10-05 人工智能

1263阅读

Meta又给OpenAI一记重击，视频生成Movie Gen震撼登场，甚至可以配音、编辑

在 OpenAI Sora 难产的时候，Meta 首次公开展示了自家的「用于媒体的突破性生成式 AI 研究」:Meta Movie Gen。 Meta 在相应博客中使用了「premiere」一词，也就是初次展示，因此手痒的用户可能还得再等上一段时间。 M...

大数据 2024-10-05 人工智能

1273阅读

Datawhale X 魔搭 AI夏令营第四期-AIGC方向Task2笔记

baseline的流程图 Baseline代码 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch-...

人工智能 2024-10-05 人工智能

1663阅读

AI绘画系统开发：你真的准备好了吗？

在这个人工智能飞速发展的时代，AI绘画系统似乎成为了炙手可热的话题。它不仅在艺术创作领域掀起了一股浪潮，还为很多设计师和艺术家带来了全新的创作方式。但问题是，开发一个真正实用的AI绘画系统，真的像听起来那么简单吗？从...

生成式AI 2024-10-04 人工智能

1051阅读

开源语音实时交互新突破：LLaMA-Omni实现大语言模型无缝语音交互

像 GPT-4o 这样的模型通过语音实现了与大型语言模型（LLMs）的实时交互，与基于文本的传统交互相比，显著提升了用户体验。然而，目前在如何构建基于开源 LLMs 的语音交互模型方面仍缺乏探索。为了解决这个问题，我们提出了 LLaMA-Omni，这是一个...

生成式AI 2024-10-04 人工智能

1675阅读

【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画

GitHub：https://github.com/BadToBest/EchoMimic 论文： https://arxiv.org/pdf/2407.08136 comfyui： https://github.com/smthemex/ComfyU...

大数据 2024-10-04 人工智能

1806阅读

用 LoRA 微调 Stable Diffusion：拆开炼丹炉，动手实现你的第一次 AI 绘画

总得拆开炼丹炉看看是什么样的。这篇文章将带你从代码层面一步步实现 AI 文本生成图像（Text-to-Image）中的 LoRA 微调过程，你将：了解 Trigger Words（触发词）到底是什么，以及它们如何影响生成结果。掌握 LoRA 微调...

大数据 2024-10-04 人工智能

2272阅读

【AI学习】AI绘画发展简史

无意中读了一篇发表自2022年的文章，《AI绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的AI绘画发展史》，写的比较有意思，科普了好多我原来不知道的历史。简单提炼一下，做个笔记。 AI绘画重要事件 2012年 Google两位大名鼎鼎的...

大数据 2024-10-03 人工智能

1815阅读

乏善可陈的第二届OpenAI开发者大会，果然没有掀起太大波澜

OpenAI 的宫斗大戏刚落下帷幕，今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。不过，与去年盛大的活动相比，今年略显低调，他们没有推出重大产品，而是选择对其现有的 AI 工具和 API 进行增量改进。在这次活动中，OpenAI 发布了四大...

AIGC 2024-10-03 人工智能

1373阅读

LLaMA-Factory 让大模型微调变得更简单！！

背景如果只需要构建一份任务相关的数据，就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作，那么必将大大减轻微调工作量。今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...

AIGC 2024-10-03 人工智能

1582阅读

奥特曼：自认比o1聪明请举手🤚到o2还这么想么🤨？｜OpenAI开发者日

这一幕，刚刚在OpenAI开发者日最后一个环节——奥特曼炉边谈话中上演。对话由奥特曼和OpenAI首席产品官Kevin Weil进行，奥特曼还对未来作出如下判断: 无限上下文长度将在十年内发生 o1正在推动智能体应用，人们将要求AI在一小时内完成以前人...

大数据 2024-10-03 人工智能

1307阅读

llama-factory实战: 基于qwen2.5-7b 手把手实战自定义数据集清洗微调

基于qwen2.5 手把手实战自定义数据集微调（llama-factory）准备工作 1.数据集准备（例:民法典.txt） 2.服务器准备（阿里云 DSW 白嫖） 3.环境配置 pip 升级模型下载微调助手 4.数据集处理脚...

生成式AI 2024-10-03 人工智能

2117阅读

Llama 3.1 技术研究报告-3

四、后训练我们通过对预训练检查点进⾏多轮后训练，或在预训练检查点的基础上与⼈类反馈（Ouyang等⼈，2022年；Rafailov等⼈，2024年）对⻬模型，以产⽣对⻬的Llama 3模型。每⼀轮后训练包括监督式微调（SFT）和直接偏好优化（DPO；...

人工智能 2024-10-02 人工智能

1605阅读

Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型

Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型，由研究者开发，旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...

生成式AI 2024-10-02 人工智能

1175阅读

【AIGC】Kolors:快手开源的文生图大模型

GitHub：GitHub - Kwai-Kolors/Kolors: Kolors Team 论文：Kolors/imgs/Kolors_paper.pdf at master · Kwai-Kolors/Kolors · GitHub comfyu...

生成式AI 2024-10-02 人工智能

1676阅读

OpenAI开发者大会推出四大创新：提示词缓存可减少50%输入token成本

10月2日消息，美东时间10月1日OpenAI举行了年度开发者大会DevDay，推出系列新工具，包括四大创新：实时API（Realtime API）、视觉微调（Vision Fine-Tuning）、提示词缓存（Prompt Caching）、模型蒸馏（M...

AIGC 2024-10-02 人工智能

1335阅读

Unsloth 教程 - 如何微调 Llama-3并导出到 Ollama

本文翻译整理自：? How to Finetune Llama-3 and Export to Ollamahttps://docs.unsloth.ai/tutorials/how-to-finetune-llama-3-and-export-to-ol...

大数据 2024-10-02 人工智能

3455阅读

如何利用 Whisper 模型进行多语言语音识别的优化和定制？

关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公...

大数据 2024-10-02 人工智能

1424阅读

llama factory LoRA微调qwen大模型 | 新手炼丹记录(1)

往期回顾 llama factory LoRA微调qwen大模型 | 新手炼丹记录(1 -CSDN博客大模型使用llama.cpp转换gguf格式并量化 | 新手炼丹记录(2 -CSDN博客 oll...

生成式AI 2024-10-02 人工智能

2012阅读

LLaMa-Factory入门教程

LLaMa-Factory是一个基于人工智能技术的开源项目，专为大型语言模型（LLMs）的微调而设计。它提供了丰富的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景。以下将详细介绍如何使用LLaMa-Factory：...

生成式AI 2024-10-02 人工智能

1635阅读

中科院提出GPT-4o实时语音交互的开源对手：Llama-Omni

论文：LLaMA-Omni: Seamless Speech Interaction with Large Language Models地址：https://arxiv.org/pdf/2409.06666 研究背景研...

生成式AI 2024-10-01 人工智能

1341阅读

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

快科技10月1日消息，AMD发布了自己的首个小语言模型(SLM ，名为AMD-135M”。相比于越来越庞大的大语言模型(LLM ，它体积小巧，更加灵活，更有针对性，非常适合私密性、专业性很强的企业部署。 AMD-135小模型隶属于Llama家族，有两个版...

大数据 2024-10-01 人工智能

1281阅读

LLM大模型之Rag检索增强生成演变成GraphRAG

RefAug：prompt增强训练LLM https://github.com/ytyz1307zzh/RefAug Learn Beyond The Answer: Training Language Models with Reflect...

大数据 2024-10-01 人工智能

1829阅读

保姆级 Stable Diffusion 教程，看完这篇就够了！

在美国科罗拉多州举办了一场新兴数字艺术家竞赛，一幅名为《太空歌剧院》的作品获得“数字艺术/数字修饰照片”类别的一等奖，神奇的是，该作品的作者并没有绘画基础，这幅画是他用 AI 生成的。这让人们充分见识到AI 在绘画领域惊人的创造力，AI 作品不仅可...

AIGC 2024-10-01 人工智能

1480阅读

1500+ HuggingFace API token暴露，使数百万 Meta-Llama、Bloom 等大模型用户面临风险

HugginingFace 和 GitHub 是AI开发人员的重要平台，因此我们决定对这些平台做更为深入的研究。在这项研究中，我们发现了数以千计的 API 令牌，这些令牌暴露给恶意行为者，使数百万最终用户可能受到攻击。本文的主要内容包括：...

人工智能 2024-10-01 人工智能

1400阅读

Meta Llama 3介绍及其关键技术

随着深度学习算法的突破和发展，语言模型已经成为连接人与机器的重要桥梁。在这一领域中，Meta的Llama 3 作为最新一代的大规模预训练模型，凭借其卓越的性能和广泛的应用前景，正逐渐成为行业内的佼佼者。 Llama 3 的研发团队继承了前代模型的技术优势...

AIGC 2024-09-30 人工智能

1720阅读

AI日报：智谱开源图像生成模型CogView3；AI声音克隆差点骗走律师父亲3万美金；GGHead颠覆3D建模

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、文生图卷起来了!智谱开源图像生...

AIGC 2024-09-30 人工智能

1041阅读

给AI公司“打杂”，95后华人把估值做到138亿美元

在旧金山的 Showplace 广场，一栋曾经属于Airbnb的商业大楼最近迎来了新主人。在大部分科技公司都在业务收缩的当下，Scale AI，这家由95后华人创立的人工智能数据标注公司，大手一挥租下了旧金山市中心约18万平英尺的办公室。就在不久前，Sc...

AIGC 2024-09-30 人工智能

1125阅读

使用 GaLore 预训练LLaMA-7B

项目代码： https://github.com/jiaweizzhao/galorehttps://github.com/jiaweizzhao/galore 参考博客： https://zhuanlan.zhihu.com/p/686686751...

生成式AI 2024-09-30 人工智能

1323阅读

陶哲轩全网悬赏「最强大脑」！AI+人类颠覆数学难题？凡尔赛网友已下场

【新智元导读】最近，陶哲轩向广大网友和数学爱好者发起了挑战:大众数学爱好者、证明助理、自动化助手和AI联合起来，是否可以证明扩展几个数量级的数学问题? 想参加陶哲轩发起的「众包」数学研究项目吗? 机会来了! AI辅助证明数学研究，越来越可行了在传统上，...

AIGC 2024-09-30 人工智能

963阅读

3天把Llama训成Mamba，性能不降，推理更快！

近日，Mamba方面又搞出了有意思的研究：来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。\ 先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（...

生成式AI 2024-09-30 人工智能

1399阅读

LlaMa-Factory源码解析之预训练LLaMA-Factory/src/llamafactory/train/pt/workflow.py -＞ run_pt()

LLaMA-Factory/src/llmtuner/train/pt/workflow.py at main · hiyouga/LLaMA-Factory · GitHub 截止至2024年7月，该框架workflow.py目录从LLaMA-Fact...

生成式AI 2024-09-30 人工智能

1503阅读