-
Stable Diffusion 3: Research Paper
Stable Diffusion 3: Research Paper 1. 核心理念 扩展模型 (Stable Diffusion 在與 DALL·E 3、Midjourney v6 和 Ideogram v1这些图像生成系统相比,在书写效果以及...
-
AI日报:GPTs靠边站!Claude推全新功能Projects;Figma大更新!AI设计几秒成稿;阿里Qwen-2稳夺全球开源大模型榜首
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Claude推类GPTs功能P...
-
AIGC“人才工厂“:助力B端企业的AI+转型和电商宣传
元壤教育:我们专注于培养AIGC新质人才,免费为3000万大学生和待业人群提供专业教育和职业发展机会,同时为企业定制AIGC人才工厂服务,助力构建高效人才梯队并解决营销、销售和推广难题。 引言: 先说一下目前的AI发展状况:人工智能(AI)的迅猛发展,...
-
哈啰集团全面接入通义灵码,AI 生成代码占比 20%,研发提效 12%
6月21日,在阿里云 AI 智领者峰会上海站,哈啰集团算法总监贾立宣布,哈啰集团已全面接入阿里云通义灵码专属版,不仅提升了内部研发效率,实现 AI 代码采用率超过20%,还将灵码接入了哈啰自研C o pilot“海螺机器人”共同帮助用户实现智能代码补全、进...
-
(5-5-02)金融市场情绪分析:使用Llama 2 大模型实现财经信息的情感分析微调(2)
5.5.4 Llama-2语言模型操作 编写下面的代码,功能是加载、配置 Llama-2 语言模型以及其对应的分词器,准备好模型为后续的对话生成任务做好准备。 model_name = "../input/llama-2/pytorch/7b-h...
-
Whisper开源免费的语音识别:OpenAI如何用AI改变字幕制作与语音理解的未来!
OpenAI的Whisper语音识别系统的用途广泛且强大,主要包括但不限于以下几点: 会议和讲座记录转写:Whisper可以帮助学生和职场人士快速将会议、讲座或课堂的录音转换成文字稿,便于复习、整理笔记或分享内容。 视频字幕生成:对于电影和电视节...
-
Kimi创始人套现4000万美元疑云|「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局|中国AI活化石,熬成AIGC第一股| 谁在制造小米汽车?
Kimi创始人套现4000万美元疑云 「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局 苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相 特斯拉的反围剿战术还剩下啥? 腾讯出手,投了家创新药公司 谁在制造小米汽车? 估值...
-
基于Llama 3的最强开源医疗AI模型OpenBioLLM-Llama3,刷新榜单
项目概述 OpenBioLLM-70B是一款先进的开源生物医学大型语言模型,由Saama AI实验室基于Llama 3技术精心开发并微调。此模型专为生物医学领域设计,利用尖端技术,在多种生物医学任务中实现了最先进的性能表现。 背景: Saam...
-
GPT-4o攻破ARC-AGI无法被挑战的神话!71%准确率成新SOTA
【新智元导读】号称不可能轻易被击败的AGI基准ARC-AGI被GPT-4o撼动,GPT-4o以在公共测试集50%、在训练集71%的准确率成为了新的SOTA! ARC-AGI是唯一可以用来衡量通用人工智能进展的基准,创造者François Chollets曾...
-
高考志愿服务,一张AI搜索的现实考卷
随着最后一笔落下,承载着高考考生们的知识考卷就此完成。另一张更为复杂的现实考卷——志愿填报,悄然摆在了家长和考生们的面前。 2024是多个省份进入新高考的第一年,新高考为考生带来了更大的选择空间和自由度,一些地区的考生需要填报的志愿数量达到几十、上百个。...
-
科技爱好者纷纷上场,AI预测足球赛事又现新方法
2024年欧洲杯比赛正酣。在赛场之外,一些围绕观赛的自发科技创新也开始涌现,成为了一道独特的风景。 近日,据TuGraph图计算官方微信,其创新小组研发了一项融合图计算、大模型等技术的足球赛事分析工具“智猜足球”,旨在探索新兴人工智能技术在体育赛事应用的可...
-
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。 Gemini1.5P...
-
硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
本文分享自华为云社区《KubeEdge:基于大模型边云协同的机器人语义分割算法》,作者:云容器大未来。 近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而,边缘环境中的资源限制往往会限制这种视觉大模型在本地部署,从...
-
大模型论文解读|| 数学新巅峰,微软&清华联合研究发现:7B级LLaMA-2模型数学能力惊人,准确率高达97.7%
开篇:数学能力在常规语言模型中的崭露头角 数学能力长期以来被认为是语言模型中难以攻克的领域,只有在模型规模极大或经过大量数学相关预训练的情况下才可能显现。然而,最新的研究表明,即使是规模较小的常规语言模型,如LLaMA-2 7B,也已经展现出了强大的数学...
-
如何免费用 Llama 3 70B 帮你做数据分析与可视化?
快速、强悍且免费,你还等啥? Llama 3 的发布,真可谓一石激起千层浪。前两天,许多人还对「闭源模型能力普遍大于开源模型」的论断表示赞同。但是,最新的 LLM 排行榜(https://chat.lmsys.org/?leaderboar...
-
轻松识别Midjourney等AI生成图片,开源GenImage
AIGC时代,人人都可以使用Midjourney、Stable Diffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。...
-
Stable Diffusion详细教程
目录 ?引言 ?Stable Diffusion基本概念 ?潜在扩散模型 ?图像生成原理 ?Stable Diffusion安装部署 ?环境要求 ?安装步骤 ?Stable Diffusion阶段 ?准备阶段 ?训练阶段 ?评估阶...
-
GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高
【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。 此前,MIT研究发现,AI...
-
听懂狗叫未来可期:利用AI解读狗叫准确率达70%!
快科技6月9日消息,近期,科学家们在解读狗叫声的情感和意图方面取得了突破性进展。 据媒体报道,密歇根大学与墨西哥国家天体物理、光学和电子研究所(INAOE)的研究人员合作,开发了一种AI模型,能够以高达70%的准确率识别狗的叫声是在玩耍、生气还是表达其他情...
-
周鸿祎炫高考作文押题10中3:展示360AI搜索预测能力
在6月6日的360AI新品发布会上,周鸿祎现场展示了360AI搜索的预测能力,他大胆预测了2024年高考作文题目。而就在今天上午全国高考语文考试结束后,这一预测被证实极具前瞻性。有网友发现,周鸿祎昨日现场预测的10道高考作文题中,竟然精准地押中了本次高考北...
-
OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!
【新智元导读】今天,OpenAI发布了一篇GPT-4可解释性的论文,似乎是作为前两天员工联名信的回应。网友细看论文才发现,这居然是已经解散的「超级对齐」团队的「最后之作」。 前两天,OpenAI的一群员工刚刚联名发表公开信,表示自主的AI系统正在失控,呼吁...
-
OpenAI前员工预测:2027年AGI降临!GPT智商飙升,4年从幼儿园蹿到高中生
AGI到底是科技公司画的大饼,还是可预测的未来? 几天前,Anthropic一名25岁的高管在博客上发文,表示自己已经准备好了3年后退休,让AI取代自己的工作。 最近,OpenAI前员工的一篇博客文章也有类似的观点。 图片 他不仅认为AGI很可能实现,而...
-
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著的成就,几乎成为了AI领域的主导技术。 然而,虽然Transformer架构及其众多变体在实践中取得了巨大成功,但其设计大多是基于经验的,...
-
快速学会一个算法,CNN
今天给大家分享一个超强的算法,CNN 卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,广泛应用于图像和视频分析、自然语言处理和其他相关领域。CNN 通过模拟生物视觉系统的处理方式,能够自动学习数据的层次...
-
LLM | Yuan 2.0-M32:带注意力路由的专家混合模型
图片 一、结论写在前面 Yuan 2.0-M32,其基础架构与Yuan-2.0 2B相似,采用了一个包含32位专家的专家混合架构,其中2位专家处于活跃状态。提出并采用了一种新的路由网络——注意力路由器,以更高效地选择专家,相比采用经典路由网络的模型,其准...
-
基于机器学习的金融欺诈检测模型
作者 | 陈峻 审校 | 重楼 引言 如今,基于互联网服务的欺诈案例时常登顶媒体头条,而使用在线服务和数字交易的金融行业尤其成为了重灾区。网络洗钱、保险欺诈、网银盗用、虚假银行交易等复杂金融欺诈行为层出不穷,我们亟待通过行之有效的欺诈识别与检测的...
-
LLM | 偏好学习算法并不学习偏好排序
图片 一、结论写在前面 偏好学习算法(Preference learning algorithms,如RLHF和DPO)常用于引导大型语言模型(LLMs)生成更符合人类偏好的内容,但论文对其内部机制的理解仍有限。论文探讨了传统观点,即偏好学习训练模型通过...
-
微软发布大规模大气基础模型Aurora,用AI预测全球极端天气
微软近日发布了首个大规模大气基础模型 Aurora,这一模型利用人工智能技术,能够预测全球范围内的极端天气事件。与当前数值预报系统相比,Aurora 的计算速度提高了约5000倍,拥有超高的准确率和效率。这一模型的发布标志着天气预测领域迎来了重大突破。...
-
AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解
不久前,AlphaFold3横空出世,直接登上了Nature头版。 新的架构、前所未有的预测精度和准确率,再次震撼了整个学术界。 然而,与AlphaFold2不同,这个新一代的超强模型却没有开源。 取而代之的是,谷歌DeepMind推出了一个免费研究平...
-
Defog发布Llama-3-SQLCoder-8B,文本转SQL模型,性能比肩GPT-4,准确率超90%,消费级硬件可运行
前言 在计算语言学领域,将自然语言转化为可执行的SQL查询是一个重要的研究方向。这对于让那些没有编程或SQL语法知识的用户也能轻松访问数据库信息至关重要。Defog团队近日发布了基于Llama-3的SQLCoder-8B模型,它在文本转SQL模型领域取得...
-
ICML2024高分!魔改注意力,让小模型能打两倍大的模型
改进Transformer核心机制注意力,让小模型能打两倍大的模型! ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。 DCMHA解除...
-
使用LLaMA Factory来训练智谱ChatGLM3-6B模型
使用LLaMA Factory来训练智谱ChatGLM3-6B模型时,以下是一个训练过程: 1. 环境搭建 a. 安装Python和Anaconda 下载并安装适合你操作系统的Python版本(推荐Python 3.10或更高版本)。 安装Anac...
-
快速评测已有的中文llama-3开源模型(4月25日更新)
Llama-3刚出来不到一周,就有一些中文微调模型了。 我快速的对这些模型进行了基准测试,时间仓促,没有办法面面俱到,仅供参考。 中文评测数据集选择的是C-Eval(valid),英文选择的是MMLU(valid),评测指标是准确率, 越高越好。 中...
-
谷歌DeepMind:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了
【新智元导读】刚刚,谷歌DeepMind、JHU、牛津等发布研究,证实GPT-4的心智理论已经完全达到成年人类水平,在更复杂的第6阶推理上,更是大幅超越人类!此前已经证实,GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被LLM甩在后面...
-
谷歌为AI搜索结果辩护: “数据空白” 和奇怪问题导致
谷歌最近推出了其 AI 搜索结果,却让数百万用户感到困惑。在搜索中,用户得到了一些奇怪的建议,比如在披萨上涂胶水以帮助奶酪粘住,或者建议吃石头。 谷歌紧急删除了一些不准确的 AI 搜索结果,称之为 AI 概述,但损害和模因化已经造成。在公司搜索主管利兹・...
-
论坛图片采集防错位全攻略
随着互联网技术的快速发展,论坛作为信息交流的重要平台,日益增长的图片内容为用户带来了丰富的视觉体验。然而,随之而来的图片采集问题也逐渐凸显,尤其是采集过程中的错位现象,严重影响了用户体验和信息传播的准确性。本文将从技术与实践的角度出发,深入探讨论坛图片如何...
-
通过强化学习策略进行特征选择
特征选择是构建机器学习模型过程中的决定性步骤。为模型和我们想要完成的任务选择好的特征,可以提高性能。 如果我们处理的是高维数据集,那么选择特征就显得尤为重要。它使模型能够更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。 在本文中,我们将...
-
超强!必会的十大机器学习算法
1.线性回归 线性回归是用于预测建模的最简单且使用最广泛的机器学习算法之一。 它是一种监督学习算法,用于根据一个或多个自变量预测因变量的值。 定义 线性回归的核心是根据观察到的数据拟合线性模型。 线性模型由以下方程表示: 其中 是因变量(我们想要预测...
-
AlphaFold 3不开源,统一生物语言大模型阿里云先开了!
把169861个生物物种数据装进大模型,大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系,在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。 模型名为LucaOne,由阿里云...
-
研究发现:OpenAI 的 GPT-4 在金融分析领域具有 “相对优势”:
根据芝加哥大学布斯商学院的一项研究,OpenAI 的 GPT-4在金融分析和预测方面超越了人类分析师,即使没有行业特定信息。这项研究上周公布,发现 GPT-4这一大型语言模型在分析财务报表和预测未来收益方面表现出色。研究称:“即使没有任何叙述或行业特定信息...
-
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
如今,想训个SOTA的大模型,不仅缺数据和算力,甚至连电都不够用了。 最近马斯克就公开表示,因为苦于买不到足够的芯片,xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本,甚至需要10万个H100,按每台H100售价3万美元来算,仅芯片就要花...
-
实战whisper语音识别第一天,部署服务器,可远程访问,实时语音转文字(全部代码和详细部署步骤)
Whisper是OpenAI于2022年发布的一个开源深度学习模型,专门用于语音识别任务。它能够将音频转换成文字,支持多种语言的识别,包括但不限于英语、中文、西班牙语等。Whisper模型的特点是它在多种不同的音频条件下(如不同的背景噪声水平、说话者的口音...
-
GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示
AI发展到今天,其智能水平与人类相比已经不遑多让了,没有一个人可以像AGI一样「包罗万象、吐纳自如」。 这个时候,我们如何还能守住人之为人的尊严? 有的人说,至少人类是社会性的存在,我们可以听得懂同类的「弦外之音」,可以与他人产生共情,而机器是冰冷的。...
-
AI日报:确认!iOS18将用上ChatGPT;Suno又将推王炸级功能;谷歌AI搜索遭遇滑铁卢;Stable Assistant 可用SD3生成图片;
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、苹果已与 OpenAI 正式达...
-
研究称GPT-4 选股准确率高达 60%,被质疑数据污染
最近,一篇芝大论文引发了业内的热议,研究发现 GPT-4在选股方面的准确率高达60%,超越了大部分人类股票分析师和专业模型。这一发现让人们开始怀疑人类股票分析师是否将面临下岗的风险。然而,一些 AI 大牛对这项研究提出了质疑,指出可能存在训练数据污染的问题...
-
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?AI大牛质疑数据污染
最近,各位业内大咖都被芝大的一篇论文震惊了。 研究者发现,由GPT-4帮忙选择的股票,直接击败了人类!同时也pk掉了许多其他针对金融训练的机器学习模型。 最让他们震惊的是,LLM可以在没有任何叙述上下文的情况下,就成功分析财务报表中的数字! 图片 论文地...
-
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。...
-
尴尬!谷歌手动删除搜索中奇怪的 AI 回答
谷歌的 AI Overview 产品最近推出后,社交媒体上涌现了一些怪异的回答,例如建议用户在披萨上涂胶水或吃石头。这个失误导致谷歌不得不手动禁用特定搜索的 AI Overviews,因为各种有趣的回答很快就被发布到社交网络上。 谷歌的发言人梅根・法恩斯沃...
-
llama-factory/peft微调千问1.5-7b-chat
目标 使用COIG-CQIA数据集和通用sft数据集对qwen1.5-7b-chat进行sft微调,使用公开dpo数据集进行dpo对齐。学习千问的长度外推方法。 一、训练配置 使用Lora方式, 将lora改为full即可使用全量微调。具体的参数...
-
探秘图片爬虫:探寻数据的视觉宝藏
在今天的数字化时代,图片已经成为传递信息、表达情感的重要媒介。随着网络上图片资源的日益丰富,如何高效、准确地获取我们所需的图片成为了一个重要议题。而在这个议题中,“图片爬虫”无疑扮演着举足轻重的角色。本文将从定义、应用、技术原理、风险挑战以及未来趋势等多个...