自然语言第10页

文心一言：百度AI大语言模型的崛起

文心一言：百度AI大语言模型的崛起 1. 背景介绍 1.1 人工智能的发展历程人工智能(Artificial Intelligence, AI 是当代科技发展的重要领域,自20世纪50年代诞生以来,已经经历了几个重要的发展阶段。早期的人工智能系统主...

生成式AI 2024-06-05 人工智能

990阅读

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类Code llama

写代码神器！48个主流代码生成LLM大模型盘点，包含专用、微调等4大类学姐带你玩AI 2023-12-06 18:20 代码大模型具有强大的表达能力和复杂性，可以处理各种自然语言任务，包括文本分类、问答、对话等。这些模型通常基于深度学习架构，如Tra...

AIGC 2024-06-05 人工智能

2188阅读

LlamaFactory源码解析 PPO

class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...

生成式AI 2024-06-04 人工智能

1819阅读

斯坦福回应抄袭清华系大模型公开道歉并删除推文

斯坦福大学的一个AI团队在 5 月 29 日发布了一个名为Llama3-V的多模态大模型，并宣称只需 500 美元就能训练出一个性能与GPT4-V相媲美的模型。然而，该模型随后被指控抄袭，与国内由面壁智能和清华大学自然语言处理实验室联合推出的大模型Mini...

人工智能 2024-06-04 人工智能

799阅读

文心一言指令详解及实例分析

一、引言文心一言，作为人工智能领域的杰出代表，以其独特的自然语言处理能力和广泛的应用场景，受到了广泛的关注。文心一言指令，作为其核心功能之一，允许用户通过自然语言与文心一言进行交互，实现信息的查询、生成、理解和推理。本文将详细介绍文心一言指...

生成式AI 2024-06-04 人工智能

1302阅读

具身智能的视觉-语言-动作模型：综述

本文经自动驾驶之心公众号授权转载，转载请联系出处。 24年5月论文“A Survey on Vision-Language-Action Models for Embodied AI”。深度学习已在计算机视觉、自然语言处理和强化学习等许多领域取得了显著...

人工智能 2024-06-04 人工智能

1527阅读

大语言模型原理与工程实践：LLaMA 系列

1. 背景介绍 1.1 大型语言模型的兴起近年来，随着深度学习技术的飞速发展，大型语言模型（LLM）逐渐成为人工智能领域的研究热点。LLM 是一种基于深度学习的自然语言处理模型，能够学习大量的文本数据，并根据这些数据生成自然流畅的文本、回答问题、进行...

生成式AI 2024-06-04 人工智能

874阅读

微软ML Copilot框架释放机器学习能力

摘要：大模型席卷而来，通过大量算法模型训练推理，能根据人类输入指令产生图文，其背后是大量深度神经网络模型在做运算，这一过程称之为机器学习，本文从微软语言大模型出发，详解利用大型语言模型（Large Language Models, LLMs）解决实际机器学...

人工智能 2024-06-04 人工智能

847阅读

llama.cpp 转化 huggingface 模型失败解决路径

问题： ./main -m ./models/book_q4_K_M -n 128 报错： terminate called after throwing an instance of 'std::out_of_range' what( :...

AIGC 2024-06-03 人工智能

1972阅读

Defog发布Llama-3-SQLCoder-8B，文本转SQL模型，性能比肩GPT-4，准确率超90%，消费级硬件可运行

前言在计算语言学领域，将自然语言转化为可执行的SQL查询是一个重要的研究方向。这对于让那些没有编程或SQL语法知识的用户也能轻松访问数据库信息至关重要。Defog团队近日发布了基于Llama-3的SQLCoder-8B模型，它在文本转SQL模型领域取得...

人工智能 2024-06-03 人工智能

1217阅读

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。 Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实...

大数据 2024-06-03 人工智能

872阅读

时间序列分析的表示学习时代来了？

表示学习作为深度学习中的核心，近期越来越多的被应用到了时间序列领域中，时间序列分析的表示学习时代已经来了。本文为大家带来了2020年以来顶会的5篇时间序列表示学习相关的核心工作梳理。 1.Unsupervised Scalable Representa...

大数据 2024-06-03 人工智能

873阅读

【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么

LLaVA++能够为Phi-3和Llama-3带来的主要好处包括：视觉处理能力的增强：通过整合Phi-3和Llama-3模型，创建了具备视觉处理能力的Phi-3-V和Llama-3-V版本，这意味着这些模型现在能够理解和生成与图像相关的内容[1]。...

生成式AI 2024-06-03 人工智能

1136阅读

探索文心一言指令：AI与自然语言处理的新篇章

引言：自然语言处理与文心一言指令的探索（1）自然语言处理的发展及其重要性自然语言处理（NLP）是人工智能（AI）的一个关键领域，致力于使机器能够理解、解释和响应人类语言的方式。自从20世纪50年代计算机科学诞生以来，NLP已经从简单的模式识...

大数据 2024-06-03 人工智能

1187阅读

浅说文心一言

文心一言（ERNIE Bot）是一个基于Transformer结构的知识增强大语言模型，它可以根据用户的指令和输入，生成相应的回答或文本。以下是一些常见的指令示例，你可以根据需要进行调整：问答指令： "请问什么是文心一言？" "文心一言和C...

生成式AI 2024-06-02 人工智能

896阅读

AIGC如何改变人类生活20240529

AIGC如何改变人类生活随着人工智能技术的不断发展，人类生活正经历着前所未有的变革。在这个过程中，AIGC（人工智能生成内容）的概念应运而生，它已经在很多领域产生了深远的影响。本文将探讨AIGC如何改变人类生活，以期为读者提供更多关于这一创新技术的启...

大数据 2024-06-02 人工智能

901阅读

当前时机是否适合进入AIGC行业：机会与挑战

目录前言 1 行业发展阶段与前景 1.1 行业发展现状 1.2 市场需求和潜力 1.3 技术创新驱动发展 1.4 多领域应用拓展 2 行业竞争情况 2.1 市场竞争激烈 2.2 竞争优势分析 3 市场对AIGC人才的需求 3.1 人...

大数据 2024-06-02 人工智能

918阅读

AIGC 技术及应用初探

ChatGPT 相关话题近一年多来被刷爆，利用 AI 技术生成内容，引起了各行各业的关注。其实，自2022 年 4 月起，OpenAI、Google、Microsoft 相继发布了文生图模型，视觉创作就已经开始持续火热了。国内 AIGC 相关的技术和应用也...

人工智能 2024-06-01 人工智能

881阅读

AI助手对决：ChatGPT vs 文心一言

背景介绍在当今人工智能技术飞速发展的时代，AI助手已经成为我们日常生活中不可或缺的一部分。而在众多AI助手中，ChatGPT和文心一言可以说是备受瞩目的两大代表，它们在智能回复、语言准确性、知识库丰富度等方面都有着自己的...

生成式AI 2024-06-01 人工智能

1413阅读

AI、AGI、AIGC、AI Agent、Prompt、LLM 名词解释

啊！ChatGPT 最近很火呀，你们说的 AGI、AIGC、AI Agent、Prompt、LLM … 到底是什么意思啊？还有 Midjourney、Lensa、Sora、DALL-E、Llama … 又是什么鬼？ AI（Artificial Int...

人工智能 2024-06-01 人工智能

1184阅读

【史上最全之 ChatGPT 和文心一言对比】

ChatGPT 和文心一言哪个更好用？在当今的AI助手领域中，ChatGPT与文心一言无疑是备受瞩目的两位选手。两者分别由美国OpenAI公司和中国百度研发，均致力于提供卓越的人工智能对话体验。接下来，我们将从智能回复、语言准确性以及知识库丰富度等核...

人工智能 2024-05-31 人工智能

1092阅读

一文读懂构建多代理的 AutoGen 开源框架

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - AutoGen -一个统一的多代理对话框架。想象一下这样一个场景：我们不再是单枪匹马独自作战，而是拥有一支高度个性化、跨领域整合的人工智能团队。每位团队成...

AIGC 2024-05-31 人工智能

1571阅读

自动采集文章：技术创新助力内容生产与信息传播

随着科技的飞速发展，自动化技术在各行各业的应用越来越广泛。其中，自动采集文章技术作为一种新兴的内容生产工具，正逐渐改变着传统的内容生产方式和信息传播模式。本文将深入探讨自动采集文章技术的原理、应用场景以及未来发展趋势，分析其对内容生产和信息传播领域的影响。...

人工智能 2024-05-31 大数据

923阅读

GitHub Copilot Workspace：欢迎进入原生Copilot开发环境

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同...

人工智能 2024-05-31 人工智能

1022阅读

如何看待AIGC技术？未来已来，请做好准备！

文章目录前言令人震撼无限可能核心优势背后力量双刃剑总结前言我正在写一篇关于人工智能对人类工作影响的文章，突然，我的电脑屏幕上弹出一条消息：“嘿，伙计，介意让我写一点吗？” 我吓了一跳，然后意识到是我自己的...

生成式AI 2024-05-31 人工智能

872阅读

用自然语言来编程GitHub Copilot；提高代码质量开源工具GPTLint；LLMs开源医学Meditron

✨ 1: GitHub Copilot Workspace 以Copilot 为中心的创新开发者环境，让开发者能用自然语言从构思到编码再到软件开发。 GitHub Copilot Workspace是一个以Copilot为中心的开发者环境，...

AIGC 2024-05-30 人工智能

954阅读

降低AIGC检测的策略与方法

随着人工智能技术的飞速发展，AIGC（Artificial Intelligence Generated Content，人工智能生成内容）已经广泛应用于各个领域。然而，随之而来的是AIGC检测技术的挑战。如何降低AIGC检测成为了一个备受关注的研究课题。...

大数据 2024-05-30 人工智能

1188阅读

通用大模型研究重点之五：llama family

LLAMA Family decoder-only类型 LLaMA（Large Language Model AI）在4月18日公布旗下最大模型LLAMA3，参数高达4000亿。目前meta已经开源了80亿和700亿版本模型，主要升级是多模态、长文本方...

AIGC 2024-05-30 人工智能

1168阅读

AI新时代——【深度学习】驱动的【AIGC大模型】与【机器学习】的创新融合

目录 1.机器学习与人工智能的基础 1.机器学习的基本原理 2.人工智能的广泛应用 2.深度学习的崛起 1.深度学习的概念和原理 2.卷积神经网络（CNN） 3.循环神经网络（RNN） 3.AIGC大模型的创新 1.AIGC的概念和应用...

AIGC 2024-05-30 人工智能

987阅读

从“采集txt”看数字化时代的数据处理与价值挖掘

在当今数字化时代，数据已经渗透到我们生活的方方面面。其中，“采集txt”作为一种常见的数据获取方式，不仅体现了数据处理技术的发展，更揭示了数据背后蕴藏的巨大价值。本文将从“采集txt”的角度出发，探讨数字化时代的数据处理与价值挖掘。一、什么是“采集txt”...

生成式AI 2024-05-29 大数据

895阅读

ai写作软件推荐哪个？选这6个让写作变得简单又高效

转眼间已到了四月中旬，部分大学生们还在为毕业论文犯愁。选题、构思、撰写，每一步都充满了挑战与困扰。时间紧迫、思路枯竭、文笔不济……这些问题成了许多毕业生心中的“拦路虎”，让人望而生畏。别担心！今天来给大家安利6款超好用的AI写作生成软件，让它们...

生成式AI 2024-05-29 人工智能

923阅读

马斯克烧60亿美元难题，国内大厂有解？开源MoE模算效率黑马登场，3.7B参数单挑Llama 3-70B

如今，想训个SOTA的大模型，不仅缺数据和算力，甚至连电都不够用了。最近马斯克就公开表示，因为苦于买不到足够的芯片，xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本，甚至需要10万个H100，按每台H100售价3万美元来算，仅芯片就要花...

人工智能 2024-05-29 人工智能

908阅读

一文带你了解大模型：智能体（Agent）

作者 | lucasgftang 大语言模型 vs 人类大语言模型很强大，就像人类的大脑一样拥有思考的能力。如果人类只有大脑，没有四肢，没有工具，是没办法与世界互动的。如果我们能给大模型配备上四肢和工具呢？大模型是不是就会打破次元壁，从数字世界走向现实...

生成式AI 2024-05-29 人工智能

2446阅读

你所不知道的机器学习五大学派

机器学习是人工智能的重要分支，它赋予计算机从数据中学习的能力，并能够在无需明确编程的情况下改进自身性能。机器学习在各个领域都有着广泛的应用，从图像识别和自然语言处理到推荐系统和欺诈检测，它正在改变我们的生活方式。机器学习领域存在着多种不同的方法和理论，其...

生成式AI 2024-05-29 人工智能

1106阅读

大模型中GPTs，Assistants API, 原生API的使用场景？

在大模型的使用中，GPTs、Assistants API和原生API各有其独特的应用场景和优势。以下是它们各自的使用场景： GPTs场景：自然语言处理任务： GPTs擅长处理各种自然语言处理任务，如文本生成、翻译、摘要、情感分析等。对话系统：用于构...

AIGC 2024-05-29 人工智能

790阅读

“一键采集天涯帖子”探秘：技术助力信息收集

在数字时代，随着互联网技术的不断发展，人们对于信息获取的速度和广度提出了更高要求。尤其是像天涯社区这样汇聚了大量网民观点和意见的平台，其帖子内容往往蕴含着丰富的社会动态和民情民意。因此，“一键采集天涯帖子”这样的技术手段应运而生，成为助力信息收集的利器。本...

生成式AI 2024-05-28 大数据

893阅读

文心一言 vs GPT-4 ----全面横向比较

文心一言 (Wenxin Yiyan 和 GPT-4 是两个强大的人工智能语言模型，它们在处理自然语言方面表现出了出色的能力。但它们有一些关键的区别和优势。以下是它们的横向比较：公司和平台： * 文心一言是由百度开发的中文语言模型，专...

AIGC 2024-05-28 人工智能

1429阅读

Llama中文大模型-模型预训练

Atom系列模型包含Atom-7B和Atom-13B，基于Llama2做了中文能力的持续优化。Atom-7B和Atom-7B-Chat目前已完全开源，支持商用，可在Hugging Face仓库获取模型:https://huggingface.co/Flag...

人工智能 2024-05-28 人工智能

932阅读

TigerGraph CoPilot如何实现图形增强式AI

想了解更多AIGC的内容，请访问： 51CTO AI.x社区 https://www.51cto.com/aigc/ 通过对比其他商用LLM的缺陷，本文详细介绍了TigerGraph CoPilot的主要功能、优点、以及两个关键用例。近年来，数据作为...

人工智能 2024-05-28 人工智能

861阅读

ESP32接入国产大模型之文心一言：开启AI新篇章

随着人工智能技术的不断发展，AI模型的应用场景越来越广泛。作为国内领先的AI大模型，文心一言已经成为了众多企业和开发者的首选。而ESP32作为一款功能强大的微控制器，也广泛应用于各种智能硬件和物联网领域。近日，ESP32成功接入文心一言，这一合作将为AI应...

大数据 2024-05-28 人工智能

1420阅读

百度文心大模型学习机“小度学习机Z30”发布

近日，百度旗下的小度科技正式推出了首款基于文心大模型的学习机Z30，已在京东平台全面开售。这款学习机以“重新定义AI老师”为核心理念，旨在通过先进的AI技术助力孩子主动学习，同时让家长享受全陪伴的超省心体验。其8GB RAM +256GB存储空间的版本售价...

大数据 2024-05-28 人工智能

847阅读

百度文心一言用户破 2 亿，李彦宏：文心大模型已成中国最领先的 AI 基础模型

过去，开发者用代码来改变世界，未来，自然语言将成为通用的编程语言。用代码书写历史的程序员会被 AI 取代吗？一个全知全能的大模型能适配一切吗？大模型成本过高怎么办？在这个 AI 时代，什么样的工具才能被称为最好用的工具？这些问题，并非空中楼阁，而是...

AIGC 2024-05-28 人工智能

904阅读

一文读懂 Arthur Bench LLM 评估框架

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。众所周知，LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...

生成式AI 2024-05-27 人工智能

831阅读

AIGC全面介绍

随着人工智能技术的飞速发展，AIGC（Artificial Intelligence Generated Content）作为人工智能领域的重要分支，正逐渐崭露头角，成为推动人类社会进步的重要力量。本文将对AIGC进行全面介绍，包括其定义、发展历程、技术原...

生成式AI 2024-05-27 人工智能

1157阅读

NL2SQL进阶系列(3)：Data-Copilot、Chat2DB、Vanna Text2SQL优化框架开源应用实践详解[Text2SQL]

NL2SQL进阶系列(3 ：Data-Copilot、Chat2DB、Vanna Text2SQL优化框架开源应用实践详解[Text2SQL] NL2SQL基础系列(1 ：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面...

生成式AI 2024-05-27 人工智能

1087阅读

一文深度剖析 ColBERT

近年来，向量搜索领域经历了爆炸性增长，尤其是在大型语言模型（LLMs）问世后。学术界开始重点关注如何通过扩展训练数据、采用先进的训练方法和新的架构等方法来增强 embedding 向量模型。在之前的文章中，我们已经深入探讨了各种类型的 embeddin...

大数据 2024-05-27 人工智能

911阅读

手撕Llama3第1层: 从零开始实现llama3

一、Llama3的架构在本系列文章中，我们从头开始实现llama3。 Llama3的整体架构：图片 Llama3的模型参数：让我们来看看这些参数在LlaMa 3模型中的实际数值。图片 [1] 上下文窗口（context-window）在实例化Lla...

人工智能 2024-05-27 人工智能

1931阅读

铭飞CMS爬虫技术深探与应用前景

在当今信息化高速发展的时代，内容管理系统（CMS）成为了企业、组织和个人建立网站、发布信息的重要工具。而铭飞CMS，作为一款功能强大、易于扩展的CMS系统，在市场上占有重要地位。然而，随着数据的需求日益增长，如何从铭飞CMS中高效地获取和整合信息成为了一个...

人工智能 2024-05-27 大数据

878阅读

Llama大型语言模型原理详解

Llama大型语言模型是一种基于深度学习的自然语言处理模型，它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理，包括其结构、训练过程以及工作机制，帮助读者深入理解这一先进的模型。一、模型结构 Llama模型...

人工智能 2024-05-27 人工智能

907阅读

深入解析“mipcms爬虫”：探寻数据抓取与处理的智能之道

在当今数字化时代，信息数据已成为核心资源，而爬虫技术则是获取这些数据的重要手段之一。本文将围绕“mipcms爬虫”展开深入讨论，探究其原理、应用场景以及未来发展趋势，旨在为读者提供全面、详尽的了解。一、引言随着互联网技术的飞速发展，数据已成为各行各业竞相争...

人工智能 2024-05-27 大数据

858阅读