-
中国AI独角兽资本大冒险
冰火两重天。 成立不过一年多时间,月之暗面已然成为中国大模型赛道上,最炙手可热的明星公司。 5 月 21 日,华尔街见闻获悉,月之暗面将按照投前估值 30 亿美元(合217. 3 亿人民币)进行融资,完成后依然是当前中国估值最高的AI创业公司。 过去一年,...
-
AIGC-controlnet代码详细解读
hugging face 社区diffusers官方代码:stable_diffusion/controlnetcontrolnet.ipynb 原始代码的解读可以看看这个博主的:万字长文解读Stable Diffusion的核心插件—ControlNet...
-
Python爬虫入门(一)(适合初学者)
Python爬虫入门(一 (适合初学者) 关于爬虫是什么,怎样保证爬虫的合法性小编在这就不再过多的阐述,从本章起,小编将和大家一起分享在学习python爬虫中的所学,希望可以和大家一起进步,也希望各位可以关注一下我! 首先我们来初步了解下如何使用开发...
-
前Reddit CEO称科技巨头AI竞赛过度导致产品质量下降
前 Reddit CEO Yishan Wong 指出,科技巨头对人工智能(AI)的过度迷恋已经开始影响他们推出的产品质量。在周三的一篇文章中,Wong 表示:“大型互联网巨头正陷入 AI 的模因竞争中,而 Google 对 OpenAI 的生存恐惧则处于...
-
2024中国人形机器人产业发展分析与解读
APP 下载地址:https://www.oschina.net/app...
-
ambientGPT:开源多模态MacOS基础模型操作界面 可调用GPT-4o API
最近,一款名为 ambientGPT 的开源项目备受关注。这款工具是一款多模态 MacOS 基础模型操作界面,可以调用 GPT-4o API 或者本地开源模型进行问答,并能直接访问屏幕内容而不需要截图。它的本地模型是基于 Apple 的 MLX 库,技术栈...
-
AI 如何颠覆社交互动?两位 Snap 工程师做了这款表情包产品
“生成式 AI 技术正引领一场社交媒体自我表达的革命。从Remini的黏土滤镜到 Easel 的表情包,图像生成领域的创新产品不断涌现。生成式技术、社交媒体与自拍照的结合,为用户提供了前所未有的个性化和创意表达空间。“ Sense 思考 我们尝试基于文章内...
-
末日滤镜下真人和AI傻傻分不清 网友:AI特效已经到这个Level了?
5月16日,抖音博主“速速來電”发布了一条图文视频,展示了一个逼真的末日游戏滤镜,引发了网友的热议和广泛关注。视频中,他用AI特效生成的图像与真人原图对比,效果逼真到让人难以分辨孰真孰假。目前,该视频在抖音上的点赞数已达17万,转发2.4万,成为“速速來電...
-
「豆包」拉低价格线 全球大模型开卷性价比
大模型也开始打起价格战。 5月15日,字节跳动旗下火山引擎发布豆包大模型,除了针对C端用户的豆包APP可免费使用该模型的应用外,豆包大模型将B端用价拉至行业最低。 按照火山引擎总裁谭待的说法,豆包主力模型(≤32K)在企业市场的定价只有0.0008元/千T...
-
基于LangChain自查询检索器的RAG系统开发实战
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,我在浏览Max.com网站时想找一部电影看。通常,这个过程包括浏览系统呈现给我的各种列表,阅读一些相关描述,然后挑选一些看起来有...
-
从Claude 3中提取数百万特征,首次详细理解大模型的「思维」
刚刚,Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。 Anthropic 已经确定了如何在 Claude Sonnet 中表征数百万个概念。这是对现代生产级大型语言模型的首次详细理解。这种可解释性将帮助我们提高人工智能模型的安全...
-
250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞
Llama系列作为为数不多的优质开源LLM,一直受到开发者们的追捧。在Hugging Face社区的文本生成模型中,几乎是「霸榜」的存在。 就在520这天,一位名叫Nishant Aklecha的开发者在推特上宣布了自己的一个开源项目,名为「从头开始实...
-
曝斯嘉丽曾拒绝为ChatGPT配音:GPT-4o语音上线前夕,这款最像“Her”的语音却下架了!
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI的离职潮还风波未平。另一边,ChatGPT语音模式中的“Sky”突然被宣布下架。 OpenAI在推文中说:我们听到有人质疑我们如何选择 ChatGPT 中的声音,尤其是...
-
当我用AI帮我砍价,它居然上来就先给商家跪下了?
昨天,一年一度的618终于正式开售了。 鬼知道我这两个月在购物车里囤了多少的东西,就等着这波618看看能便宜多少钱。 昨天八点,我准时的打开京东还有天猫,把各种优惠一顿领,就准备开始买了。 最近正好也到了吃榴莲的季节了,榴莲盲盒也开上瘾了,但是小商超里的榴...
-
击穿全球底价!阿里云通义千问GPT-4级主力模型降价97%:约为GPT-4价格的1/400
快科技5月21日消息,今日阿里云宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。 这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。...
-
一文带您了解SHAP:机器学习的模型解释
在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(Explainable AI ,XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
AI代驾、AI泊车上线 小鹏汽车再进化:窄小车位大救星
快科技5月20日消息,小鹏汽车AI DAY发布会正在进行中,基于端到端大模型的上车,小鹏汽车首发了AI代驾和AI泊车功能。 据介绍,AI代驾能够主动洞察并且学习司机的驾驶习惯, 能够一键开启通勤智驾, 并且AI代驾也会洞察你的选路偏好,同时AI代驾也会学...
-
逻辑升级,深度解析如何实现业务中的且或组件
在业务实现的过程中,时常会出现且或关系逻辑的拼接。逻辑运算的组合使用,是实现复杂业务规则和决策支持系统的关键技术。 目前袋鼠云的指标管理平台、客户数据洞察平台、数据资产平台都有在使用。并且,且或组件已经在 RC 5.0 中添加到组件库,企业现在可以更加灵...
-
通过检索增强生成(RAG) 增强LLM的实战演练
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 拥有正确的数据来支持用例对于在任何业务中成功采用大型语言模型(LLM 都是至关重要的。虽然大多数现成的LLM在完成一般任务上表现出色,...
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。 此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama3 的纯 NumPy 实现等。 十几个小...
-
首个GPU高级语言,大规模并行就像写Python,已获8500 Star
经过近 10 年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在 GPU 上运行高级语言。 上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。 GitHub:http...
-
GPT-4o恩怨开局,Google再次躺枪
要说全世界戏最多的AI,非OpenAI莫属。 这家公司简直就是热搜制造机,刚推出新产品,就送走老领导,刚和苹果结盟,就逼跌谷歌股价;连OpenAI高管的一个离职动态,都能引发网上的OpenAI离职潮。 短短几天时间,以OpenAI为中心,接连引发地震级别的...
-
探秘视频教程采集之道,打造个性化学习资源库
随着数字化时代的到来,视频教程已成为我们获取知识与技能的重要途径。无论是专业技能的提升,还是兴趣爱好的培养,采集适合自己的视频教程都是关键一步。本文将深入探讨视频教程的采集方法,助你构建个性化、高效的学习资源库。一、明确学习目标与需求在采集视频教程之前,我...
-
70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍! 不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。 这项成果,来自爆火的AI编程神器Curso...
-
《2024 中国 AIGC 应用全景报告》发布
APP 下载地址:https://www.oschina.net/app...
-
腾讯混元将发布大模型C端App腾讯元宝:超万亿参数规模
在腾讯云生成式AI产业应用峰会上,腾讯表示,将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后,是腾讯全链路自研的通用大语言模型——混元大模型,它以其超过万亿的参数规模,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行...
-
多模态GPT-4o来了,最先嗨起来的是一波女性用户
整场发布会最为重磅的发布之一,莫过于 OpenAI 团队成员对于新模型语音能力的演示,搭载了 GPT-4o 的 ChatGPT,不仅真正实现了实时响应,可以任意打断,更重要的是,ChatGPT 第一次拥有了“察言观色”的能力,它能看到用户表情,理解用户语气...
-
李彦宏:百度11%的搜索结果都由AI生成
快科技5月17日消息,百度创始人、董事长兼首席执行官李彦宏在2024年第一季度财报电话会议上透露,目前百度搜索结果中已有11%由AI生成。 李彦宏认为,尽管百度搜索的AI重构工作仍处于早期阶段,但搜索服务最有可能成为AI时代的杀手级应用”。 百度在AI领...
-
GPT-4o:实现跨越文本与视觉的智能交互 原创
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 摘要 OpenAI最新发布的GPT-4o模型及其在多模态处理上的卓越能力,标志着人机交互迈向新的高度。GPT-4o能够处理文本、音频、...
-
路径规划概述:基于采样、搜索、优化全搞定!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1 决策控制与运动规划概述 目前决策控制方法可以分为三类:sequential planning、behavior-aware planning、和end-to-end planning。 seq...
-
魅族21系列首发!Flyme AIOS发布
快科技5月16日消息,今天下午,全新的Flyme AIOS正式发布。 Flyme AIOS的升级重点是AI”,带来了桌面AI搜索、AI生成壁纸、AI游戏超清、AI连麦对话、AI智能打码、AI笔记创作、AI全局录音、AI客服对话等等功能。 并且Flyme A...
-
通义千问 2.5 “客串” ChatGPT4,你分的清吗?
作者:张添翼、董艺荃 引子 OpenAI 发布了最新的 GPT-4o 模型,通义千问也在前不久刚发布通义千问 2.5,已经和 GPT-4-Turbo 不分伯仲: 既然目前还没有和 GPT-4o 文本生成能力的对比数据,就让我们来和大模型一起做个游...
-
百度第一季度营收315亿元 李彦宏:文心大模型将更加实惠和高效
百度公司今日公布了截至2024年3月31日的2024年第一季度财务报告,本季度,百度总营收达到315亿元,同比增长1%。 在净利润方面,百度也取得了亮眼的成绩。归属于百度的净利润为54亿元,而按非美国通用会计准则(Non-GAAP)计算,净利润更是高达70...
-
国内外大模型 “人情味” PK,调教最暖大模型
APP 下载地址:https://www.oschina.net/app...
-
599元!魅族LIVE AI真无线Hi-Fi降噪耳机发布:挑战1500元内最佳音质与降噪
快科技5月16日消息,今天下午举办的魅族21Note手机特种兵发布会上,魅族LIVE AI真无线Hi-Fi降噪耳机正式发布,目标挑战1500元内最佳音质与降噪TWS耳机。 据了解,该耳机首发搭载与楼氏联合研发的LIVE PRO正面开孔动铁单元,支持AI灵动...
-
使用开源GenAI时需要注意的十个问题
如今似乎任何人都可以制作AI模型。即使你没有训练数据或编程技巧,你也可以选择你喜欢的开源模型,对其进行调整,并以新的名字发布。 根据斯坦福大学在4月发布的AI指数报告,2023年发布了149个基础模型,其中三分之二是开源的,而且有大量的变体。Huggi...
-
花1块钱就有上万篇内容,新晋AI顶流把价格打下来了
过去几天,AI行业大事件高度密集。 先是OpenAI贴脸开大发布GPT-4o,而后谷歌I/O大会原地回击掏出华丽升级Gemini全家桶。放眼国内AI赛道,备受关注的则是字节终于高调发布豆包大模型家族。 昨天上午,当火山引擎总裁谭待宣布豆包通用模型推理输入价...
-
字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度
过去一年,围绕着字节AI的几个谜团,终于都在今天被揭开了。 5 月 15 日火山引擎Force原动力大会上,字节大模型进行了全系列更名,从云雀大模型升级为豆包大模型家族,一口气发布了 9 个豆包模型,其中包括通用模型pro版、通用模型lite版以及各个领域...
-
一些 Llama3 微调工具以及如何在 Ollama 中运行
Llama3是Meta提供的一个开源大模型,包含8B和 70B两种参数规模,涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间,并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B,其具备小尺寸和高质量的输出使其成为边缘设备或者移动设...
-
与机器对话:揭示提示工程的十个秘密
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 提示的力量十分神奇,我们只需抛出几个近似人类语言的单词,就能得到一个格式和结构都良好的答案。没有什么话题是晦涩难懂的,没有什么事实是触...
-
苹果将推出的AI补丁 用眼睛和声音控制您的 iPhone 和 iPad
苹果公司在纪念全球辅助功能意识日上宣布了即将推出的 iOS 和 iPadOS 辅助功能,旨在为残疾人士提供更便捷的体验。这些新技术不仅服务于特定群体,还可能对广大用户产生积极影响。 眼动追踪技术将成为 iPhone 和 iPad 用户的利器,无需额外硬件...
-
国内大厂“魔改”AI搜索
北京时间5月15日凌晨,被OpenAI 抢过风头的谷歌开始了绝地反击,其中就包括 AI 搜索。 比起之前的小试牛刀,谷歌这回的搜索改造进一步打开了想象的空间。搜索不止是回答还是执行,获得的不仅是难以辨别真假的回答,而是详细可执行的计划。用户的搜索不再是一次...
-
写一个类ChatGPT应用,前后端数据交互有哪几种
前言 最近,公司有一个AI项目,要做一个文档问答的AI产品。前端部分呢,还是「友好借鉴」ChatGPT。别问为什么,问就是要站在巨人的肩膀上进行「带有中国特色」的创新。而后端是接入我们团队的模型,我咨询过模型团队,也是基于开源模型做参数的微调,这个魔幻的...
-
字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
火山引擎总裁 谭待 企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。 ——谭待 火山引擎总裁...
-
字节跳动发布豆包大模型,主力模型比行业价格低99.3%
5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成...
-
美图秀秀 APP 推出“模拟市民”AI绘画特效
美图秀秀 APP 推出新功能 “模拟市民” 创意玩法。 只需打开美图秀秀APP,进入“图片美化-创意玩法-模拟市民”功能,选择你想要进行模拟的照片。 这个功能可以让用户在照片中变身不同的角色,并与照片中的世界进行互动,实现现实世界与模拟世界的完美对穿。...
-
GPT-4o实际应用案例:盲人可以更好地“看见”世界
OpenAI和Be My Eyes合作推出了一款新的APP,旨在帮助视力受限人群实时了解身边场景并提供帮助。这款APP利用了最新的GPT-4o模型,结合了实时视觉和语音能力。 通过这款APP,盲人可以随时了解自己周围的环境,并通过语音助手的帮助做出一些决策...
-
使用Quarkus和LangChain4j,LLM在Java中可以实现哪些功能?
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文试图通过一个有趣的原创项目,利用Quarkus和LangChain4j来揭开LLM在Java中使用的神秘面纱。 自从2022年11...
-
GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了
不开玩笑,电影《她》真的来了。 OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。 现场直播的效果更是炸裂: 它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打...