-
百度文心一言(千帆大模型)聊天API使用指导
开篇不得不吐槽下百度,百度智能云平台首页跳转千帆大模型平台的按钮太多了,不同按钮跳转不同的子页面,不熟悉的,能把人找懵。入口太多,就导致用户不知道从何开始。本文就从一个前端开发人员的角度,教大家快速使...
-
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力...
-
性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型
性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型...
-
中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用
中文模型:Chinese-LLaMA-Alpaca-2 。” 01 — 目前在开源大模型中,比较有名的是Meta的LLAMA模型系列和清华的ChatGLM模型。 特别是在中文领域...
-
文心一言-适用的精美 prompt-调教手册
文心一言简介 文心一言是百度推出对标chatGPT的产品,也是国内大厂首个发布的大模型语言类产品。文心一言知识增强大语言模型百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对...
-
AI大模型,如何破圈而出?
一年即将过去,回望整个2023,我们会觉得这是一个毫无疑问的“AI大模型之年”。这一年里,全球兴起了数百个大模型。根据相关报道,仅仅在中国就有超过200个大模型,形成了名副其实的“百模大战”。 但有个...
-
向“创新者”升阶,程序员当下如何应对 AI 的挑战 | 京东云技术团队
随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。 通用领域大模型的“泛化能力” 在过去的二十年内,AI 领域的大部分研究...
-
LoRA微调stable diffusion models:原理和实战
Diffusion Models专栏文章汇总:入门与实战 前言:AIGC大模型(如stable diffusion models 的训练成本已经超过绝大多数人的承受范围,如何利用已有的开源...
-
微调语言大模型选LoRA还是全参数?基于LLaMA 2深度分析
来源 | Anyscale OneFlow编译 翻译|宛子琳、杨婷 最近几个月,开源语言大模型(LLM)之间展开了与OpenAI专有模型的竞争。提升开源LLM性能的一种常用策略是全参数微调...
-
Llama 2 云端部署与API调用【AWS SageMaker】
Meta 刚刚发布了 Llama 2 大模型。如果你和我们一样,你一定会迫不及待地想要亲自动手并用它来构建。 推荐:用 NSDT设计器 快速搭建可编程3D场景。 使用任何类型的 LL...