-
美图宣布2.85亿元收购站酷 为自家AI视觉大模型生态带来优质协同效应
700万。 美图CEO吴欣鸿表示,站酷的加入将进一步提升美图影像与设计产品业务,为自家研发的AI视觉大模型Mi 美图宣布以总价3964.05万美元(约2.85亿元)收购站酷,交易结构中,1778.4万...
-
史上首个100%开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训
的核心,考虑到模型背后的巨大商业价值,最大最先进的模型的技术细节都是不公开的。 现在,真·完全开源的大模型来了! 来自艾伦人工智能研究所、华盛顿大学、耶鲁大学、纽约大学和卡内基梅隆大学的研究人员,联合...
-
匿名论文提出奇招,增强大模型长文本能力居然还能这么做
一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展? 不行,这些都太费硬件资源了。 来看一个奇妙新解: 和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。 具体办法...
-
4个国产AI大模型备案获批,众多科技巨头进入AIGC赛道
式、什么值得买、新壹科技、衔远科技、小米、智联招聘、Boss直聘、脉脉等13家企业的,14个国产AI大模型通过《生成式人工智能服务管理暂行办法》备案,可实现商业化应用。 自2023年8月,文心一言、...
-
基于LLaMA Factory,单卡3小时训练专属大模型 Agent
大家好,今天给大家带来一篇 Agent 微调实战文章 Agent(智能体)是当今 LLM(大模型)应用的热门话题 [1],通过任务分解(task planning)、工具调用(tool using)...
-
张晴晴:对话数据推动AIGC——大模型底层数据探索
许存在于数据之中...... 本文是Magic Data创始人兼CEO张晴晴博士关于数据、大模型与生成式AI的观点分享。 对话式是人机交互的关键 OpenAI成立于2015年...
-
LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比
LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比...
-
LLaMA模型指令微调 字节跳动多模态视频大模型 Valley 论文详解
en;这两个Token最终会经过映射层(Projection)与Text tokens衔接在一起送给大模型; 指令微调数据收集 作者基于MSRVTT(10k)、VATEX(22k)、Aativi...
-
大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
大模型的预训练需要耗费巨量的计算资源和数据,因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而,不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用,对预训练模型参...
-
GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评
近期,多模态大模型(LMMs)在视觉语言任务方面展示了令人印象深刻的能力。然而,由于多模态大模型的回答具有开放性,如何准确评估多模态大模型各个方面的性能成为一个迫切需要解决的问题。 目前,一些方法采...