-
AIGC: 关于ChatGPT中Function Call的调用
Function Call 概念 关于 GPT 中API的function参数,提供了一些能力 这个函数调用是 Open AI 在2023年的6.13号发布的新能力 根据它的官方描述, 函数调用能力可以让模型输出一个请求调用函数的消息 其中包...
-
Similartool.AI官网体验入口 AI工具对比选择平台免费使用地址
Similartool.AI是一个AI工具对比平台,为用户提供准确、可信赖、高影响力的AI工具推荐。平台收录众多AI工具,用户可以快速发现、比较不同的AI工具,选择最符合自己需求的产品。我们致力于成为用户的首要全面AI工具资源库。 点击前往Similar...
-
维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4
斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。此外...
-
网易有道推出“子曰”大模型2.0版本 并发布AI家庭教师“小P老师”
教育科技公司网易有道在1月3日举办的发布会上推出了国内首个教育大模型 "子曰"2.0版本,并发布了基于大模型研发的三大创新应用及一款智能硬件新品。 其中,最受关注的是 AI 家庭教师 "小 P 老师",它能够为学生提供全学段、全学科的答疑支持,并通过互动沟...
-
人工智能利用深度学习技术增强高级驾驶辅助系统(ADAS)
译者 | 李睿 审校 | 重楼 人工智能和机器学习利用深度学习技术的优势,使高级驾驶辅助系统(ADAS 发生了重大变革。ADAS在很大程度上依赖深度学习来分析和解释从各种传感器获得的大量数据。摄像头、激光雷达(光探测和测距 、雷达和超声波传感器都是传感器...
-
Stable Diffusion (持续更新)
引言 本文的目的为记录stable diffusion的风格迁移,采用diffusers example中的text_to_image和textual_inversion目录 2023.7.11 收集了6张水墨画风格的图片,采用textual_...
-
【AIGC-图片生成视频系列-4】DreamTuner:单张图像足以进行主题驱动生成
目录 一. 项目概述 问题: 解决: 二. 方法详解 a 整体结构 b 自主题注意力 三. 文本控制的动漫角色驱动图像生成的结果 四. 文本控制的自然图像驱动图像生成的结果 五. 姿势控制角色驱动图像生成的结果 2023年的最后一...
-
使用 Stable Diffusion Img2Img 生成、放大、模糊和增强
在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 3D数字孪生场景编辑器 Stable Diffusion...
-
AI行业或成2024就业新风口!钉钉联合IDC发布《2024 AIGC应用层十大趋势白皮书》
根据钉钉联合 IDC 发布的《2024AIGC 应用层十大趋势白皮书》,预测到2024年全球将涌现出超过5亿个新应用,AIGC 技术将呈现爆发式增长。 报告指出,AIGC 应用将在 B 端办公和生产力场景中率先落地,其中知识管理是最受企业青睐的应用场景。A...
-
黑客解锁特斯拉自动驾驶系统的“隐藏模式”
在近日举行的混沌计算大会上,来自柏林工业大学的三名网络安全研究人员演示了如何通过“电压故障攻击”成功破解特斯拉的自动驾驶系统,不但能获取系统和用户敏感数据,而且解锁了特斯拉自动驾驶的隐藏模式——“Elon模式”。 特斯拉自动驾驶的隐藏模式——“Elon...
-
2024年人工智能在能源管理领域的十大趋势
Accenture的一份报告指出,到2035年,能源领域采用人工智能可以使能源效率提高20%。 人工智能在重塑能源管理行业中发挥什么作用? 近年来,人工智能已成为能源和电力行业日益重要的技术。其可以自动化和优化各种与能源相关的活动,从而提高运营效率和成...
-
2024年AI还能帮你干什么?这十个趋势必须关注
元旦节收假,你身心都复工了吗? 新的一年,有没有跟我一样,既想打工挣钱花,又想从具体任务中解放出来的?最好是能在新的一年,实现个人能力的极大增强…… 所以今天,咱们就好好说一说,新的一年里,怎样能让AI多给自己帮帮忙(doge)。 或许你已经关注到了,...
-
基于whisper和whisperx的语音视频和字幕对齐
环境的安装 创建py310虚拟环境,需要安装Anaconda的Python环境。 Python初学者在不同系统上安装Python的保姆级指引 Win10+Python3.9+GPU版pytorch环境搭建最简流程 Python虚拟环境的安装和使用...
-
Nudify.co官网体验入口 AI图片去衣应用免费下载地址
Nudify.co是一款利用AI技术从图片中移除衣物的应用。这款工具的使用非常简单方便,用户只需选择并上传想要处理的图片,即可快速查看去衣后的效果,并有选项下载保存处理后的图片。 点击前往Nudify.co官网体验入口 Nudify.co的目标用户群...
-
BetterYeah AI体验入口 企业级AI应用开发平台免费使用地址
BetterYeah AIAgent是一个高级的企业级AI应用开发平台,专注于构建业务专家级的AI工作助理。这个平台内置了多种成熟的模板,功能强大而且开箱即用,支持快速应用落地。它还支持私有化部署,确保企业数据的安全性。BetterYeah AI可以一键解...
-
2024年无线技术将如何改善连通性、效率和消费者体验
在2024年,无线技术预计将带来多方面的改善,提升连通性、效率和消费者体验,将改变无线技术在全球社区和企业中的使用方式,包括改善连接性、效率和新的消费者体验。 在未来,10GBPS的速度将是无处不在的 互联网服务提供商(isp 提供比以往更快的互联网速...
-
全球首家AI餐厅开业 机器人全自动做汉堡和炸薯条
全球首家全自动、由人工智能驱动的餐厅CaliExpress by Flippy于去年12月在南加州开业。在这家餐厅,机器人负责烹饪汉堡和炸薯条。 来到餐厅的客人下单后,可以观看机器人从头到尾准备饭菜,顾客还可以对订单进行定制。 这家餐厅是由科技公司 Ca...
-
阿里AI项目DreamTalk开源 可让人物头像说话
阿里巴巴宣布其项目DreamTalk已经开源。这个项目可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配。 模型下载地址:https://huggingface.co/damo-vilab/dreamtalk 项目地址:htt...
-
百度大模型这一年:文心一言国内首个用户破亿,飞桨开发者超千万
文心一言用户规模破1亿,飞桨的开发者数量达到1070万。 只用短短两个月,文心大模型4.0整体效果又提升了32%。 2023年12月28日,在刚刚过去的 WAVE SUMMIT+2023深度学习开发者大会上,百度揭幕了文心大模型与深度学习平台飞桨的一系列新...
-
M2UGen体验入口 AI多模态音乐生成框架免费下载地址
M2UGen是一款结合大语言模型的多模态音乐理解和生成框架,旨在协助用户进行音乐创作。它能同时完成音乐理解和多模态音乐生成任务,为音乐创作、音乐理解研究和音乐应用开发提供了强大的支持。 点击前往M2UGen体验入口 M2UGen适用于哪些用户? M2U...
-
MidReal官网体验入口 AI文本冒险游戏平台免费使用地址
MidReal是一个基于先进AI技术的文本冒险游戏平台。该平台具有强大的长篇叙事能力和近乎无限的记忆能力,能够根据玩家的选择生成连贯、沉浸式的故事剧情。玩家可以在多种世界观和场景中自由选择角色,创造独特的冒险体验。 点击前往MidReal体验入口 适用人...
-
突破Pytorch核心点,CNN !!!
哈喽,我是小壮! 创建卷积神经网络(CNN),很多初学者不太熟悉,今儿咱们来大概说说,给一个完整的案例进行说明。 CNN 用于图像分类、目标检测、图像生成等任务。它的关键思想是通过卷积层和池化层来自动提取图像的特征,并通过全连接层进行分类。 原理 1.卷...
-
4D 毫米波雷达SLAM 方案调研
本文经自动驾驶之心公众号授权转载,转载请联系出处。 前言 Image Radar即4D 毫米波雷达,它输出3D位置+径向速度,相对于传统的3D毫米波雷达(2D位置+速度)多了一维高度信息输出。Image Radar具备传统3D雷达所有的特点,同时弥补了...
-
AI智能写作算法:揭秘黑科技,无所不能的写作能力,真实度高到爆表
敬爱的读者们,您好!我叫老李,今天很愿意为您揭晓有关Ai智能写作算法的神秘面纱。此项技术想必您都有所耳闻,却对其强大之处知之甚少。没关系,接下来就让我带您领略这种前沿科技的独特魅力!期待与您共同发现更多精彩内容! 【1.算法背后的黑科技】 首先,让我们...
-
MyShell发布开源AI语音克隆工具OpenVoice,瞄准语音模仿领域
MyShell最新推出的开源语音克隆工具OpenVoice引起了广泛关注。这一创新产品由麻省理工学院(MIT)、清华大学以及加拿大人工智能初创公司MyShell合作开发。OpenVoice采用了一种概念简单但高效的方法,可几乎即时克隆用户的语音,并使用明显...
-
精选了6款好用的AI绘画工具,值得一试
近几年来,伴随着AI技术的发展,设计领域发生了巨大的变化。AI绘图工具的出现很大程度上减轻了设计师的工作负担,本文精选了6款优秀的AI绘图工具为大家推荐,一起来看看吧! 1、即时灵感 即时灵感作为国产的AI绘图工具,使用起来相对来说更加方便。它采用先进...
-
AIGC产业研究报告2023——视频生成篇
易观:今年以来,随着人工智能技术不断实现突破迭代,生成式AI的话题多次成为热门,而人工智能内容生成(AIGC)的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势,易观对AIGC产业进行了探索并将发布AIG...
-
2023年十大人工智能安全故事
生成式人工智能在 2022 年底席卷全球,让人工智能领域在 2023 年成为众人瞩目的焦点。 IBM 表示,尽管人工智能的采用率猛增,到 2023 年,35% 的企业将使用人工智能,42% 的企业将在未来探索人工智能的实施,但新的担忧也出现了。 以下是...
-
Copilot AI 编程训练营第二天:1 小时 0 手写开发一个购物车系统
经过训练营第一天的学习,大家都已经能基本熟练的使用 GitHub Copilot 进行辅助编程啦。 第二天,是考验学习成果的一天,我们需要在 2 小时内,通过 GitHub Copilot 完全 0 代码开发一个购物车系统。 熟练使用的同学,大概 1...
-
将 GitHub Copilot 与 ChatGPT 进行较量
最紧迫的问题是:哪种人工智能辅助代码生成最适合当今的开发人员?与以代码为中心的王牌 Copilot 一起工作是否会更好?还是 ChatGPT 的灵活性和多才多艺的方法使其占据了上风?这是专家与全能选手的对决,我们即将投入其中! 让我们深入探讨这场人工智能...
-
2024年生成式AI支出将翻倍,到2027年将超1500亿美元
据国际数据公司(IDC)的预测,2023年全球企业在生成式人工智能(GenAI 解决方案上的投资已达194亿美元,预计在2024年将翻番。该预测还指出,包括GenAI软件、相关硬件和服务在内的支出将在2027年达到1511亿美元,年均增长率为86.1%。...
-
清华大学研发 LLM4VG 基准:用于评估 LLM 视频时序定位性能
12 月 29 日消息,大语言模型(LLM)的触角已经从单纯的自然语言处理,扩展到文本、音频、视频等多模态领域,而其中一项关键就是视频时序定位(Video Grounding,VG)。 VG 任务的目的基于给定查询(一句描述),然后在目标视频段中定位...
-
面向未来的数据安全的人工智能解决方案
如今,在快速发展的数字世界中,企业领导者正在应对大量数据安全威胁。网络攻击不仅更加复杂,而且成本高昂,全球平均违规损失超过450万美元。随着数据对我们的日常工作变得非常重要,改变我们保护数据安全的方式也非常重要。事实证明,在网络周围筑墙的传统安全措施是...
-
展望未来:人工智能的2024年
从生成式人工智能(GenAI 工具到拥抱AIOps,以下是人工智能的未来。 当我们站在2024年的边缘时,人工智能(AI 的发展轨迹将重新定义创新的边界。回顾生成式人工智能的历史,很明显,像ChatGPT和Bard这样的模型主要专注于文本处理。虽然具有...
-
LangSplat官网体验入口 AI 3D场景构建软件工具免费下载地址
LangSplat是一款利用CLIP语言嵌入映射到3D高斯分布的工具,用于构建3D语言场景并实现对3D场景的开放词汇量查询。它提高了处理效率,避免了NeRF中的昂贵渲染过程,并且学习到的语言特征能精确捕捉对象边界,提供精确的3D语言场景,无需后处理。Lan...
-
「灌篮高手」模拟人形机器人,一比一照搬人类篮球招式,看一遍就能学会,无需特定任务的奖励
投篮、运球、手指转球…这个物理模拟人形机器人会打球: 图片 会的招数还不少: 图片 一通秀技下来,原来都是跟人学的,每个动作细节都精确复制: 图片 这就是最近一项名为PhysHOI的新研究,能够让物理模拟的人形机器人通过观看人与物体交互(HOI)的演示,...
-
《我的世界》化身AI小镇,NPC居民角色扮演如同真人
注意看,这个方块人正在快速思考面前几位“不速之客”的身份。 原来她是遇到了危险,意识到这一点之后,她马上开始在脑海中搜索策略。 最终,她的方案是先逃跑然后寻求帮助,并马上付诸行动。 与此同时,对面的人也在进行着和她一样的思考…… 这样的一幅场景出现...
-
AnyText图文融合体验入口 AI多语言视觉文本生成工具软件免费下载地址
AnyText 图文融合是一种基于扩散的多语言视觉文本生成和编辑模型,专门用于在图像中渲染准确且连贯的文本。它能够根据提供的图像和文本输入生成自然且逼真的合成图像。AnyText的优点包括对多语言输入和输出的支持,渲染的文本的准确性和连贯性,以及提供丰富的...
-
AI "取代" 人类职业的路径图
昨天看到这么一张图:AI 取代人类路径的级别图。 图片 根据图中的显示,分了 6 个等级:E1 到 E8+ 。 从图中我们可以看出:AI 取代人类路径是按 AI 的应用领域路线决定。而 AI 应用领域路径是由容错率决定的。 这里的容错率简单的来讲的话,就...
-
还不知道?近20+自动驾驶数据集、榜单和Benchmark汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.Nuscenes 数据集链接:nuScenes nuscenes数据集下有多个任务,涉及Detection(2D/3D)、Tracking、prediction、激光雷达分割、全景任务、规划控制等...
-
网络安全专家 Mikko Hyppönen 对 2024 年的五大 AI 网络威胁发出警告
在网络安全前线战斗了数十年的 Mikko Hyppönen,这位 54 岁的专家最近在一次视频通话中向 TNW 透露了他对 2024 年最令人担忧的五大人工智能(AI)网络威胁。这些威胁并没有特定的顺序,尽管其中有一个是导致他最为失眠的。 深度伪造(...
-
Stable Diffusion 告别猜关键词,LoRA适配关键词自动生成
有没有想想过在SD绘图的时候下载好的LoRA模型选择之后不生效是为什么?或者说关键词不知道怎么填写? 这里介绍基于 Civitai 的LoRA 使用方法。 文章目录 Civitai 插件 使用方法 Civitai 插件...
-
stable diffusion webui 教程:安装与入门
stable diffusion webui 安装与入门 原理简介 一、源码仓库 二、模型库地址 三、在 Windows 上自动安装步骤 安装Python 安装git 下载源代码 编辑 webui-user.bat 四、如何打开 五、依据文...
-
微软推出AI助手Copilot的正式版本;ChatGPT:七位研究人员分享他们的观点
? AI新闻 ? 微软推出AI助手Copilot的正式版本 摘要:微软宣布其AI助手Copilot正式上线,此前Copilot的预览版已成为很多用户的日常AI伴侣。此次上线后,Copilot将继续提供AI驱动的网络聊天体验,并具备商业数据保护功能,...
-
全面理解Stable Diffusion采样器
全面理解Stable Diffusion采样器 原文:Stable Diffusion Samplers: A Comprehensive Guide 在 AUTOMATIC1111 的 SD webui 中,有许多采样器(sampler)...
-
基础模型+机器人:现在已经走到哪一步了
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
最新国内使用GPT4教程,GPT语音对话使用,Midjourney绘画,ChatFile文档对话总结+DALL-E3文生图
一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结+DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以...
-
Stable Diffusion---Ai绘画-下载-入门-进阶(笔记整理)
前言 注:本文偏向于整理,都是跟着大佬们学的。 推荐两个b站up主,学完他们俩的东西基本就玩转SD为底的ai绘画:秋葉aaaki,Nenly同学 1.首先SD主流的就是秋叶佬的Webui了,直接压缩包下载即可,下载地址在这个视频的简介里:https...
-
手把手教你通过PaddleHub快速实现输入中/英文本生成图像(Stable Diffusion)
近来,基于Diffusion的文图生成模型比较火,用户输入一句话,模型就可以生成一副对应的图像,还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程,以供参考。 1、安装PaddlePaddle PaddleHub底层依赖于百度自研的...
-
AIGC和虚拟现实为什么必然产物
背景 在流量存量时代,内容运营重要性不言而喻。在流量时代,内容可以不要过于多样化和差异化,只需要有足够多的人流量,按流量转化比率来看,1000个人有1%概率转化,素材不变只要增加足够多的流量那就一定会有收益。所以在流量时代,运营提出的打法就是“黑客增长”...