-
沉浸式音频技术的制作,采集,播放及应用
沉浸式音频技术近年来逐渐扩大其应用范围,常见应用于VR,影视,会议等场景。本文由时代拓灵创始人&CEO,孙学京博士LiveVideoStack线上分享的内容整理而成,从声场采集,传输,渲染播放算法以及软硬件等方面详细介绍了沉浸式音频技术的发展与应用...
-
写给小白系列之爬虫篇,爬虫与防爬虫
目录 1.爬虫技术概述 1.1网络爬虫 1.2传统爬虫 1.3聚焦爬虫 1.3.1相对于通用网络爬虫,聚焦爬虫还需要解决的三个主要问题 2.爬虫原理 2.1 网络爬虫原理 2.2 网络爬虫系统的工作原理 2.2.1网络爬虫的基本工作流程如...
-
从零开始入门 K8s | 可观测性:监控与日志
作者 | 莫源 阿里巴巴技术专家 一、背景 监控和日志是大型分布式系统的重要基础设施,监控可以帮助开发者查看系统的运行状态,而日志可以协助问题的排查和诊断。 在 Kubernetes 中,监控和日志属于生态的一部分,它并不是核心组件,因此大部分的能...
-
用c语言实现网络爬虫,C语言编写网络爬虫
C语言编写网络爬虫 #include #include #include #include #pragma comment(lib, "ws2_32.lib" //加载网络支持的库 #define _M_MPPC u...
-
抖音数据采集教程,Retrofit 开发与 hook
抖音数据采集教程,Retrofit 开发与 hook 短视频、直播数据实时采集接口,请查看文档: TiToData 免责声明:本文档仅供学习与参考,请勿用于非法用途!否则一切后果自负。 Retrofit 文中所有 Retrofit 都...
-
005:认识Python爬虫框架之Scrapy
本篇文章带大家认识一下网络爬虫框架Scrapy。 什么是框架: 在建筑学概念中,框架是一个基本概念上的结构,用于去解决或者处理复杂的问题。通俗来说也就是一个有约束性的架子。 在我们计算机领域中,特指为解决一个开放性问题而设计的具有一定约...
-
bilibili用户信息爬虫(全网最全)
bilibili用户信息爬虫 bilibili用户已经突破7亿了(根据UID来看) Github: Leopard-C/BiliUserSpider 0. 成果 bilibili御坂网络计划:https://misaka.sisters.top...
-
采集电子报纸
项目托管于Github 1、接口 /** *报纸采集器 * @author 杨尚川 */ public interface PaperCollector { /** * 下载当日报纸,一个文件对应一个版面 ...
-
Play Framework - 数据采集
准备工作: 环境: A.mysql5.6 mysql设置编码: ...
-
STM32HAL ADC+TIM+DMA采集交流信号 基于cubemx
ADC+TIM+DMA采集交流 前言 本文主要讲解定时器触发ADC去采集交流信号,DMA把数据搬移到内存。 所需工具: 开发板:STM32F103C8T6 STM32CubeMX IDE: Keil-MDK 相关文章: STM32HAL...
-
多模态音乐AI框架Video2Music 为视频生成情感相符的音乐
近日,一款创新的人工智能多模态音乐生成框架Video2Music引起了广泛关注。该框架利用独特的数据集和经过用户研究验证的转换器模型,能够为视频生成情感上相符的音乐,填补了这一领域的空白。据悉,Video2Music的GitHub Repo已经发布,为研究...
-
AI女友突然断崖式分手,独留对象在贴吧发心碎小作文!
如果 AI 女友与你断崖式分手,你会难过吗? 据 Business Insider 报道,日活几千人的 AI 陪伴服务的应用 Soulmate 因为应用的所有权公司被出售,出于业务原因决定停止运营。 这也意味着,大家朝夕相处的「AI 伴侣」即将消失。 从...
-
马斯克版ChatGPT背后开发工具上线!xAI产品两连发,网友:交付速度太疯狂
马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了! 就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。 一个用于提示工程和可解释性研究的集成开发环境。 xAI表示,他们打造PromptIDE的最初目的,是加速其聊天AI机...
-
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;美团首个AI产品“Wow”亮相;百家号AI笔记功能将下线
???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务 在OpenAI首届开发者大会DevDay活动上,OpenAI发布了GPT-4Turbo模型和自定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态AP...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界
北京大学和北京智源人工智能研究院的团队提出了名为LLaMA-Rider的训练框架,旨在让大型语言模型在开放世界中具备自主探索和学习任务的能力。这个框架通过反馈-修改机制来实现主动探索,使模型在环境中接收反馈信息,不断调整决策,从而逐渐适应开放环境。 项目...
-
OpenAI 推出「GPTs」预见 AI「随需应变的超级能力」的未来
OpenAI 在周一的一场旧金山开发者大会上,宣布了对其人工智能平台的最新更新,这包括为开发者提供更低的价格和能力强大的定制「代理」人工智能,从洗衣建议到合同谈判均能提供帮助。 自从一年前 ChatGPT 引人注目地首次亮相以来,生成式 AI 的潜在...
-
实战 | 详解Apollo 换道
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.介绍 1.1. 换道的功能 简单地说, 换道的作用就是从待选地参考线中选择其中一个参考线, 供 Planning 后续模块进行使用. 需要说明的是, Apollo 所开源出的换道代码经过了过多的...
-
强化学习与多任务推荐
一、短视频推荐两阶段约束强化学习算法 首先介绍的一项快手自研的 WWW 2023 Research Track 工作,主要解决短视频推荐场景下的带约束多目标优化问题。 在短视频推荐单列场景中,用户通过上下滑形式和系统进行交互,观看多个视频。用户对每个...
-
马斯克版ChatGPT爆火来袭!不用Python,11人爆肝两个月
马斯克突然出手截胡,抢在OpenAI开发者大会前发布大模型Grok。 与其他ChatGPT类产品不同,Grok可以实时从?推文中获取最新知识,比如马斯克刚刚与Joe Rogan的最新访谈。 图片 巨量、实时且独特的?数据构成了Grok的最大护城河,早在7...
-
GPT-4+Midjourney零代码做「愤怒的南瓜」!实测体验:门槛不低,很难复现
【新智元导读】国外网友分享了一个只用AI工具制作游戏的教程,在外网爆火。但亲自尝试之后发现,真的想要做出像样的游戏,远远没有想想那么简单。 通过市面上的AI工具,不需要自己亲自写一行代码,就能做出一个完整的「愤怒的小鸟」?! 最近,外国网友分享了自己花了1...
-
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;钉钉 AI 魔法棒正式上线;马斯克𝕏AI团队首批产品曝光
???AI应用 Gen-2史诗级更新 允许用户通过简单文本生成4K高清视频 Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。 Gen-2体验地址:https://rese...
-
GPT-4+Midjourney零代码做「愤怒的南瓜」!实测体验:门槛不低,很难复现
通过市面上的AI工具,不需要自己亲自写一行代码,就能做出一个完整的「愤怒的小鸟」?! 最近,外国网友分享了自己花了10个小时,通过GPT-4和DALL-E 3/Midjourney做了个愤怒的小鸟的教程,3天之内已经超过了270万的浏览。 图片 还曾登顶...
-
马斯克𝕏AI团队首批产品曝光 包括Grok和PromptIDE
马斯克的?AI团队最近曝光了他们的首批产品,其中包括了Grok和PromptIDE。Grok与AI信息检索相关,而PromptIDE的字面理解是“提示词工作站/集成开发环境”。这一消息是通过推特博主@Asuna Gilfoyle - e/acc披露的,而且...
-
Gen-2颠覆AI生成视频!一句话秒出4K高清大片,网友:彻底改变游戏规则
这,绝对称得上是生成式AI进程中的里程碑。 就在深夜,Runway家标志性的AI视频生成工具Gen-2,迎来了“iPhone时刻”般的史诗级更新—— 依旧是简单一句话输入,不过这一次,视频效果一口气拉到了4K超逼真的高度! 话不多说,我们直接来看炸裂的效...
-
阿里云发布通义星尘、通义灵码等产品 推出大模型应用开发平台阿里云百炼
在昨日的2023云栖大会上,阿里云发布了多个重要的产品和技术。 首先是通义大模型家族的更新。阿里云发布了千亿级参数规模的大模型通义千问2.0,综合性能超过了 GPT-3.5,正在追赶 GPT-4。此外,通义千问 APP 也在各大手机应用市场上线,用户可以直...
-
阿里云推出“通义灵码”AI 编程工具,支持 VS Code、JetBrains 等主流 IDE
11 月 1 日消息,阿里云目前推出了一款 AI 编程工具“通义灵码”,号称基于自家通义大模型打造,IT之家的小伙伴们可以点击此处访问项目官网。 据悉,“通义灵码”兼容 Visual Studio Code、JetBrains IDEs 等主流 IDE...
-
AI视野:英伟达发布大模型ChipNeMo;百度推出文心一言会员;OpenAI潜入黑客群聊;微软AI助手Copilot上线
????大模型动态 英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo,专注于辅助芯片设计,提高工程师的工作效率,支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...
-
GPT-4写代码,DALL·E 3+MJ搞定画面,AI版「愤怒的南瓜」来袭
自 GPT 系列对话大模型以及 DALL・E、Midjourney 等文生图大模型兴起以来,基于它们的硬核、有趣二创应用花样频出,让普通人切身地体验到了大模型的魅力。 今天又一个这样的游戏项目引起了我们的注意。 推特用户 @javilopen 使用 GP...
-
GPT-4写代码,DALL·E 3+MJ搞定画面,AI版「愤怒的南瓜」来袭
自 GPT 系列对话大模型以及 DALL・E、Midjourney 等文生图大模型兴起以来,基于它们的硬核、有趣二创应用花样频出,让普通人切身地体验到了大模型的魅力。 今天又一个这样的游戏项目引起了我们的注意。 推特用户 @javilopen 使用 GPT...
-
“AI”被柯林斯词典评选为2023年最受关注的词汇
柯林斯词典宣布,“AI”(人工智能)已经成为2023年最受关注的词汇。这个决定是基于“AI”在过去一年中使用频率的四倍增长,以及它作为代表未来发展的技术已经成为今年的热门话题。 “AI”被定义为“通过计算机程序模拟人类思维功能”,因其快速发展和成为2023...
-
AI自动生成创意视频:如何让大模型助你一臂之力
作者 | 崔皓 审校 | 重楼 摘要 本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程,包括问题分析、目标设定、工具和模型选择,以及实际操作步骤。使用的技术和工具包括OpenAI的G...
-
AI编程,详细比较GitHub Copilot对比Amazon CodeWhisperer
1、简介 GitHub Copilot和Amazon CodeWhisperer是采用人工智能技术驱动的编码助手,它们将自动完成编码功能提升到一个全新的水平。在最佳状态下,它们可以根据开发者提供的简短描述性文本编写功能完整、可运行的代码块。这可以让开发者...
-
使用Llama index构建多代理 RAG
检索增强生成(RAG 已成为增强大型语言模型(LLM 能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示,RAG为LLM提供了有用的上下文,以产生基于事实的输出。 但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题...
-
使用Panda-Gym的机器臂模拟进行Deep Q-learning强化学习
强化学习(RL 是一种机器学习方法,它允许代理通过试错来学习如何在环境中表现。行为主体因采取行动导致预期结果而获得奖励,因采取行动导致预期结果而受到惩罚。随着时间的推移,代理学会采取行动,使其预期回报最大化。 RL代理通常使用马尔可夫决策过程(MDP ...
-
AI如何影响数字化转型
数字化转型是十多年来业务转型的核心,随着AI的崛起,数字化转型本身也在发生改变。AI正在极大地改变数字化转型,从企业设定的目标到从业者用来推进倡议的工具。 产生影响的因素包括传统的AI技术,如ML,以及快速增长的GenAI领域,后一种技术正迅速在企业I...
-
【深度学习】生成对抗网络(GANs)详解!
一、概述 生成对抗网络(Generative Adversarial Networks 是一种无监督深度学习模型,用来通过计算机生成数据,由Ian J. Goodfellow等人于2014年提出。模型通过框架中(至少 两个模块:生成模型(Generat...
-
三星 One UI 6 更新新增 AI 相机功能 旨在提升摄影体验
三星日前发布了 One UI 6 更新,为 Galaxy 系列手机的相机应用带来了多项新功能,无论是专业摄影师还是普通手机用户,都能从中受益。新功能主要集中在新的 三星 Galaxy Enhance-X 应用中,该应用旨在简化拍照流程,并确保每张照片的质量...
-
从单机到多机的无人机与机器人集群的SLAM综述
本文经自动驾驶之心公众号授权转载,转载请联系出处。 前言 在本系列,我将会更新我的博士毕业论文“Decentralized and Distributed Collaborative Simultaneous Localization and Mapp...
-
科学春晚,还得是B站:稚晖君机械臂搭广寒宫,院士下半身直接消失
听闻B站要搞一场科学春晚——超级科学晚。 这种热闹,我们必然火速赶到第一现场来感受感受。 作为一场科学为主题的晚会,最值得关注的自然是在晚会中展示的一个个创意实验。 最令现场“wow”声一片的,是中国科学院院士褚君浩解释葫芦娃六娃的隐身秘诀。还原地演示了...
-
人工智能教程(一):基础知识
如今,计算机科学领域的学生和从业者绝对有必要了解人工智能artificial intelligence、数据科学data science、机器学习machine learning、深度学习deep learning方面的基本知识。但是应该从哪里开始呢?...
-
首个人体动捕基模型面世!SMPLer-X:横扫七大榜单
人体全身姿态与体型估计(EHPS, Expressive Human Pose and Shape estimation)虽然目前已经取得了非常大研究进展,但当下最先进的方法仍然受限于有限的训练数据集。 最近,来自南洋理工大学S-Lab、商汤科技、上海人...
-
生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型
「从头分子设计」是材料科学的「圣杯」。生成深度学习的引入极大地推进了这一方向,但分子发现仍然具有挑战性,而且往往效率低下。 以色列理工学院(Technion-Israel Institute of Technology)和意大利威尼斯大学(Univers...
-
AI视野:OpenAI成全球第三最有价值初创公司;SDXL推精简版本;小米14将搭载WPS AI功能;Bing AI拒绝生成女性逼真图像
???AI应用 SDXL推精简版本SSD-1B 推理速度提升60% Segmind Stable Diffusion1B(SSD-1B)是一款高效、高速的文本生成图像AI模型,为图像生成提供广泛可能性,它是稳定扩散XL的精简版本,体积减小50%,但速度提升...
-
如何使用GPT作为SQL查询引擎的自然语言
译者 | 李睿 审校 | 重楼 如今,得益于ChatGPT这种生成式人工智能技术,使得用简单的语句查询数据集变得非常简单。 与大多数生成式人工智能一样,OpenAI公司开发的API的结果仍然不完美,这意味着用户不能完全信任它们。幸运的是,用户现在可以...
-
腾讯混元大模型升级:新增“文生图”,代码能力大幅提升
10月26日,腾讯宣布,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。 作为实用级的通用大模型,腾讯混元大模型的应用...
-
数字人+AI换脸简单实现虚拟制片
概述 本文将从零开始介绍如何创造并驱动数字人,最后通过AI换脸实现虚拟制片。效果如下: 数字人驱动 换脸憨豆先生 数字人简介 数字人(Digital Human / Meta Human),是运用数字技术创造出来的、与人类形象接近的数字化人物形象。数字人...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
免费开源AI视频工具VideoCrafter:输入文本轻松生成高质量视频
VideoCrafter是一款全新的开源视频创建和编辑套件,采用了扩散模型,能够从文本描述生成照片和视频逼真的输出。 尽管尚未正式发布,但VideoCrafter有望显著改变视频制作流程。使用VideoCrafter,即使没有视频编辑或动画经验的人也可以轻...