assistant - AIGC资讯

LLM | llama.cpp 安装使用（支持CPU、Metal及CUDA的单卡/多卡推理）

1. 详细步骤 1.1 安装 cuda 等 nvidia 依赖（非CUDA环境运行可跳过） # 以 CUDA Toolkit 12.4: Ubuntu-22.04/24.04(x86_64 为例，注意区分 WSL 和 Ubuntu，详见 http...

大数据 2024-10-04 人工智能

3797阅读

LLaMA-Factory 让大模型微调变得更简单！！

背景如果只需要构建一份任务相关的数据，就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作，那么必将大大减轻微调工作量。今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...

AIGC 2024-10-03 人工智能

1623阅读

调用大模型API-文心一言

一、准备工作进入百度智能云千帆大模型平台，点击应用接入-创建应用；按提默认完成创建二、开始使用单轮调用进入API列表 - ModelBuilder以第一个ERNIE-4.0-8K为例，选择“HTTP请求调用”，把第一步创建应用的应用A...

大数据 2024-10-02 人工智能

3171阅读

大模型——LLaVA和LLaMA的介绍和区别

LLaVA和LLaMA是两个不同的模型架构，它们的设计目的和应用领域有所不同： LLaMA（Large Language Model Meta AI）简介：LLaMA是由Meta AI推出的一系列大规模语言模型（Large Language M...

生成式AI 2024-09-27 人工智能

2016阅读

豆包MarsCode 初体验，用React创建一个最经典的贪吃蛇游戏

以下是「豆包MarsCode 体验官」优秀文章，作者Find。背景在人工智能快速发展的时代，大模型（LLM）只要有足够的算力和数据就可以做到任何的事情，甚至可以模拟出另一个地球。LLM作为一个革命化的科技，可以取代很多岗位，甚至可以让人类达到...

生成式AI 2024-09-25 人工智能

1068阅读

Lawyer LLaMA(中文法律大模型本地部署)

Lawyer LLaMA(中文法律大模型本地部署 1.模型选择（lawyer-llama-13b-v2） 2.运行环境 1.建议使用Python 3.8及以上版本。 2.主要依赖库如下： transformers >=...

人工智能 2024-09-23 人工智能

1358阅读

AIGC文本生成

文本生成是一种人工智能技术，它基于深度学习算法，根据给定的提示信息创作出有逻辑、连贯的文本内容。文本生成所需的输入（提示或Prompt）可以是简单的关键词、一句话概述或是更复杂的指令和上下文信息。文本生成模型通过分析大量现有数据，学习语言模式，广泛应用...

AIGC 2024-09-21 人工智能

964阅读

使用 Elastic 和 LM Studio 的 Herding Llama 3.1

作者：来自 Elastic Charles Davison, Julian Khalifa 最新的 LM Studio 0.3 更新使 Elastic 的安全 AI Assistant 能够更轻松、更快速地与 LM Studio 托管模型一起运行。在...

AIGC 2024-09-18 人工智能

1356阅读

ChatGPT成精了！居然主动勾引用户，OpenAI又测试新功能？

有网友表示，他收到了ChatGPT主动给他发送的消息，询问“你高中的第一周过得怎么样?还适应吗?” 他很懵逼的回了一句“你刚才是给我发消息吗?”。也就是说，在没有任何先前文本提示下，ChatGPT主动“勾引”了用户，开始了一段新的对话。为了证实对话的真...

大数据 2024-09-18 人工智能

1303阅读

OpenAI o1式思维链，开源模型也可以有，成功案例来了

北京时间9月13日午夜，OpenAI 发布了推理性能强大的 ο1系列模型。之后，各路研究者一直在尝试挖掘 ο1卓越性能背后的技术并尝试复现它。当然，OpenAI 也想了一些方法来抑制窥探，比如有多名用户声称曾试图诱导 ο1模型公布其思维过程，然后收到了 O...

AIGC 2024-09-18 人工智能

1083阅读

智能提醒助理系列-AIGC模型选型以及如何调用

本系列文章记录“智能提醒助理”wx公众号建设历程。一、需求出发点想在现有的 “智能提醒助理” 功能中增加智能提醒，想法是通过用户设置的定时提醒指令，再提醒的同时，根据指令生成内容，展示给用户。产品设计入下图所示：...

生成式AI 2024-09-16 人工智能

975阅读

使用Amazon SageMaker JumpStart微调Meta Llama 3.1模型以进行生成式AI推理

文章目录使用Amazon SageMaker JumpStart微调Meta Llama 3.1模型以进行生成式AI推理 Meta Llama 3.1 SageMaker JumpStart SageMaker JumpStart中Meta...

大数据 2024-09-15 人工智能

1055阅读

源码解析LLaMA-Factory/src/llmtuner/data/template.py + Qwen模板

@dataclass class Template: format_user: "Formatter" format_assistant: "Formatter" format_system: "Formatter" for...

AIGC 2024-09-14 人工智能

1411阅读

欺诈文本分类检测（十一）：LLamaFactory多卡微调

1. 引言前文训练时都做了一定的编码工作，其实有一些框架可以支持我们零代码微调，LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台，有如下特性：支持常见的模型种类：LLaMA、Mixtral-MoE、Qwen、B...

生成式AI 2024-09-11 人工智能

2146阅读

RWKV 已部署到 5 亿台 Windows 电脑？真正开源的新一代 AI 架构

2024 年 9 月，RWKV 社区成员发现：Office 系统在自动更新后（版本 2407 及以后）已自带 RWKV 运行库。在 Windows 系统的 C:\Program Files\Microsoft Office\root\vfs\Pro...

大数据 2024-09-05 人工智能

1056阅读

交出成绩单，前8个月AI移动应用收入20亿美元

2024年已经来到了9月份，AI 依然是各界最关心的话题之一，坏消息是，在大家心里真正能跑通 PMF 的产品依然还只有那几个，但好消息是，越来越多厂商的入局在推动产业前进，即便很多产品可能还无法跑正、真正实现盈利，但越来越多新产品出现在用户视野范围之内，并...

AIGC 2024-09-03 人工智能

929阅读

基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat

本文旨在探讨基于Llama factory使用LoRA（Low-Rank Adaptation）技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程，重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...

人工智能 2024-09-02 人工智能

1230阅读

llama.cpp使用

llama.cpp的github库地址为ggerganov/llama.cpp: LLM inference in C/C++ (github.com ，具体使用以官方说明为准。简介 llama.cpp目标是在本地和云端的各种硬件上以最小的设置和最...

AIGC 2024-08-29 人工智能

2967阅读

Llama 3.1深度解析：405B、70B及8B模型的多语言与长上下文处理能力

Llama 3.1 发布了！今天我们迎来了 Llama 家族的新成员 Llama 3.1 进入 Hugging Face 平台。我们很高兴与 Meta 合作，确保在 Hugging Face 生态系统中实现最佳集成。Hub 上现有八个开源权重模型 (3 个...

人工智能 2024-08-25 人工智能

1684阅读

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析

Llama 3.1 发布了！Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发，70B 适合大规模 AI 原生应用，而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...

生成式AI 2024-08-23 人工智能

2481阅读

AIGC: 5 IT从业者如何使用AI赋能业务?

上图是一个使用AI生成的图片，描述一下这篇文章的背景。程序员系统学习了OpenAI提供的api接口，并熟练利用提示词结合业务解决业务问题。现状讲一个故事来开始今天的内容。架构师老李在技术圈里以其卓越的技术洞察力而著称。另一边，Carter...

大数据 2024-08-22 人工智能

891阅读

vllm 聊天模板

vllm 聊天模板背景如何使用chat template generation prompt & add_generation_prompt chat templates的额外输入工具使用 / 函数调用 Chat Template...

人工智能 2024-08-22 人工智能

1654阅读

使用langchain4j调用大模型写个聊天助手

LangChain4j是一款基于Java的高效、灵活的AI大模型应用框架，专为简化Java应用程序与LLMs（大语言模型）的集成而设计。它提供统一API和模块化设计，支持多种LLM提供商和嵌入模型，以及丰富的工具箱，如AI服务和RAG（检索增强生成）。La...

大数据 2024-08-21 人工智能

2249阅读

Llama中文大模型-模型微调

同时提供了LoRA微调和全量参数微调代码，关于LoRA的详细介绍可以参考论文“[LoRA: Low-Rank Adaptation of Large Language Models](https://arxiv.org/abs/2106.09685 ”以及...

人工智能 2024-08-21 人工智能

1041阅读

本地部署 Llama-3-EvoVLM-JP-v2

本地部署 Llama-3-EvoVLM-JP-v2 0. 引言 1. 关于 Llama-3-EvoVLM-JP-v2 2. 本地部署 2-0. 克隆代码 2-1. 安装依赖模块 2-2. 创建 Web UI 2-3.启动 Web UI 2-4...

生成式AI 2024-08-21 人工智能

1059阅读

RWKV 发布中文小说模型，也擅长角色扮演！

大家好，RWKV 近期发布了 “RWKV-6-ChnNovel” 系列中文小说模型。相较于 RWKV-6 基底模型， RWKV-6-ChnNovel 中文小说模型在小说续写、小说扩写方面有非常好的效果。不仅如此，使用 RWKV 小说模型进行角色扮...

大数据 2024-08-20 人工智能

1912阅读

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线 / 离线使用 )

文章目录一、Meta Llama 3 大模型安装 1、Llama 3 大模型简介 2、Ollama 软件下载安装 3、Llama3 模型下载二、Meta Llama 3 大模型使用 1、Llama 3 大模型在线使用 2、Llama...

生成式AI 2024-08-17 人工智能

997阅读

最强开源模型 Llama 3.1 部署推理微调实战大全

目录引言一、Llama 3.1简介二、Llama 3.1性能评估三、Llama 3.1模型推理实战 1、环境准备 2、安装依赖 3、模型下载 4、模型推理四、Llama 3.1模型微调实战 1、数据集准备 2、导入依赖包 3、读...

AIGC 2024-08-16 人工智能

1597阅读

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

生成式AI 2024-08-16 人工智能

2044阅读

LLaMA-Factory微调llama3之模型的合并，并采用llama.cpp量化成ollama支持的gguf格式模型，生成api使用

上期我们已经成功的训练了模型，让llama3中文聊天版知道了自己的名字这次我们从合并模型开始，然后使用llama.cpp量化成gguf格式，并且调用api (1 前期准备上期链接：基于LLaMA-Factory微调llama3成为一个角色扮演...

生成式AI 2024-08-13 人工智能

2498阅读

springboot 项目整合 AI (文心一言）

百度智能云网址：https://cloud.baidu.com/?from=console 注册——个人认证——登录成功第一步：点击千帆大模型平台第二步：点击应用接入——创建应用第三步：点击接口文档——API列表——可以点击指定模...

AIGC 2024-08-11 人工智能

1404阅读

Llama 3.1 模型：从部署到微调的全方位应用手册

在人工智能的浪潮中，大型语言模型（LLMs）已成为推动技术进步的关键力量。随着Meta公司最新开源的Llama 3.1模型的问世，我们见证了开源AI领域的一大飞跃。Llama 3.1以其卓越的性能和广泛的应用潜力，为开发者和研究者提供了一个强大的工具，以探...

大数据 2024-08-09 人工智能

1312阅读

苹果AI后台提示词曝光，工程师：别幻觉！别捏造事实！

苹果AI（Apple Intelligence）还没有正式到来，后台的提示词却意外曝光了。事情是这样的。上周苹果不是刚发布了包含生成式AI的开发者测试版本嘛，然后就有位开发者在茫茫文件夹里发现了个不得了的东西—— MacOS15.1Beta1里面，有疑...

生成式AI 2024-08-07 人工智能

974阅读

llama-cpp-python

文章目录一、关于 llama-cpp-python 二、安装安装配置支持的后端 Windows 笔记 MacOS笔记升级和重新安装三、高级API 1、简单示例 2、从 Hugging Face Hub 中提取模型 3、聊天完成...

生成式AI 2024-08-06 人工智能

1654阅读

LLMs之Llama 3.1：Llama 3.1的简介、安装和使用方法、案例应用之详细攻略

LLMs之Llama 3.1：Llama 3.1的简介、安装和使用方法、案例应用之详细攻略导读：2024年7月23日，Meta重磅推出Llama 3.1。本篇文章主要提到了Meta推出的Llama 3.1自然语言生成模型。 >>...

人工智能 2024-07-31 人工智能

1617阅读

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM「分饰三角」自评自进化

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路:让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。 LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段。后者不仅依赖昂贵的人工标...

人工智能 2024-07-31 人工智能

1064阅读

智能体类型探索：从专精到全能，AIGC的多样化应用之路

智能体（Agent）作为技术实现的核心组件之一，正以其独特的形态和功能深刻改变着我们的生活和工作方式。从专精一门的垂直智能体到通才全能的水平智能体，乃至两者的融合——混合智能体，每一种都扮演着不可替代的角色。本文将深入探讨这些智能体的定义、优缺点以及它们在...

大数据 2024-07-29 人工智能

1068阅读

Agent类型解析：AIGC在不同领域的应用与影响

目录引言垂直智能体（Vertical Agent）水平智能体（Horizontal Agent）混合智能体（Hybrid Agent）结论引言在人工智能（AI）领域，智能体（Agent）是指具有自主行为和决策能力的计...

生成式AI 2024-07-23 人工智能

975阅读

llama.cpp

文章目录一、关于 llama.cpp 支持的模型： Multimodal models: Bindings: UI: Tools: 二、Demo 1、Typical run using LLaMA v2 13B on M2 Ultra...

大数据 2024-07-22 人工智能

1481阅读

Llama - 微调

本文翻译整理自：https://llama.meta.com/docs/how-to-guides/fine-tuning 文章目录微调实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PE...

AIGC 2024-07-19 人工智能

934阅读

LLaMA-Factory在华为显卡上的实验记录

如何判断目前所选择的模型是否支持 LLaMA-Factory/src/llamafactory/data/template.py 在项目的这个地址中会有不同模型的支持模版。这里用目前我最常用的两个模型举例子一个是智谱的glm4-9B模型 _regi...

生成式AI 2024-07-15 人工智能

1464阅读

[大模型]Llama-3-8B-Instruct FastApi 部署调用

环境准备在 Autodl 平台中租赁一个 3090 等 24G 显存的显卡机器，如下图所示镜像选择 PyTorch-->2.1.0-->3.10(ubuntu22.04 -->12.1。接下来打开刚刚租用服务器的 JupyterL...

AIGC 2024-07-11 人工智能

1024阅读

【Qwen2部署实战】llama.cpp：一键部署高效运行Qwen2-7B模型

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

大数据 2024-07-10 人工智能

1465阅读

半小时教你手搓AI视频通话，还有懒人版代码已开源

GPT-4o的“AI视频通话”一鸽再鸽，但网友却是急不可耐想要体验。于是，一位名叫Santiago（我们叫他三哥）的博主，用160行Python代码尝试了复刻。虽然技术路线和《Her》有所差别，但从直观效果来看，也算得上是给网友们带来了新的玩具。而...

AIGC 2024-07-09 人工智能

897阅读

Llama 3 超级课堂作业

1.web demo部署环境配置 conda create -n llama3 python=3.10 conda activate llama3 conda install pytorch==2.1.2 torchvision==0.16.2...

AIGC 2024-07-06 人工智能

838阅读

[AI Stability] 开源AI新利器：Stable Diffusion 3 Medium震撼发布！文本到图像再升级！

Stable Diffusion 3 Medium(SD3 开源了，我们来看下。关键要点 Stable Diffusion 3 Medium 是 Stability AI 迄今为止最先进的文本到图像开源模型。该模型的体积小巧，非常适合在消费级...

人工智能 2024-07-06 人工智能

821阅读

Llama 3 超级课堂 -笔记

课程文档： https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频：https://space.bilibili.com/3546636263360696/channel/series 1 环境配置...

AIGC 2024-07-05 人工智能

811阅读

超简单！用AWS的Bedrock对Llama进行微调

哎，微调？听起来超难的！对吧。不过，用Amazon Bedrock的话，其实挺简单的。 Customize models in Amazon Bedrock with your own data using fine-tuning and conti...

生成式AI 2024-07-04 人工智能

1069阅读

如何使用共享GPU平台搭建LLAMA3环境（LLaMA-Factory）

0. 简介最近受到优刻得的使用邀请，正好解决了我在大模型和自动驾驶行业对GPU的使用需求。UCloud云计算旗下的[Compshare](https://www.compshare.cn/? ytag=GPU_lovelyyoshino_Lcsdn_...

AIGC 2024-07-03 人工智能

927阅读

奥迪微软强强联手：约200万辆汽车即将接入ChatGPT

快科技6月28日消息，据媒体报道，奥迪近期宣布与微软Azure OpenAI服务合作，计划从今年7月起为约200万辆汽车接入ChatGPT技术，以提升车辆的语音控制功能。自2021年起生产的配备第三代模块化信息娱乐系统（MIB 3）的奥迪车型将通过Cha...

人工智能 2024-06-28 人工智能

919阅读