-
让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接
来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-based human-to-robot handover policies)。这种可泛化策略使得机器人能更...
-
生成式人工智能将改变医疗保健
生成式人工智能确实在医疗保健领域发挥着重要作用,它的应用为医疗行业带来了许多变革。人工智能能够利用大数据分析、模式识别和预测分析来改善医疗保健服务的质量和效率。 生成式人工智能有望显著提高生产力,改善患者和提供者的体验,并最终带来更好的临床结果。...
-
端到端的自动驾驶会取代Apollo、autoware这类框架吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 Rethinking the Open-Loop Evaluation of End-to-End Autonomous Driving in nuScenes 作者单位:百度 作者:共一 Jian...
-
llama.cpp LLM模型 windows cpu安装部署踩坑记录
一直想在自己的笔记本上部署一个大模型验证,早就听说了llama.cpp,可是一直没时间弄。 今天终于有时间验证了。首先本机安装好g++,cmake.我下载的cmake版本是cmake-3.27.0-rc4-windows-x86_64.msi。安装时选择...
-
从ChatGPT说起,AIGC生成模型如何演进
ChatGPT是继stable diffusion 之后,又一个火出圈的人工智能算法。这火爆程度不仅仅是科研圈子,包括投资圈都为之震惊,大家惊呼人工智能可能真的要取代人类了。网上关于ChatGPT的分析文章已经非常多了,小猿经过高强度的网络冲浪,整理出了A...
-
微软在Windows 11推出Copilot,将DALL-E 3集成在Bing!
美东时间9月21日,微软在美国纽约曼哈顿举办产品发布会,生成式AI成为重要主题之一。 微软表示,Copilot将于9月26日在Windows 11中推出;Microsoft 365 Copilot 将于11 月1日向企业客户全面推出;将OpenAI最新的...
-
2023年.AI域名销售额达550万美元 2024年能达1000万美元吗?
2024年,.AI域名市场是否能够创下1000万美元的销售额? 根据域名投资专家Elliot Silver的最新文章,2023年公开报道的.AI域名销售额已经达到了550万美元,而2022年和2021年分别为90万美元和120万美元。 Silver观察到过...
-
三星将在硅谷中心举办 Unpacked 揭秘全新AI聊天机器人
Galaxy Unpacked正式宣布,其下一代旗舰智能手机系列——Galaxy S24,将于1月17日星期三在加利福尼亚州圣何塞的SAP中心揭晓。这一令人期待的活动将在三星的YouTube页面上于太平洋时间上午10:00/ 东部时间下午1:00进行直播。...
-
版权过期后,米老鼠SD模型上线 以后可以放心用AI画米老鼠了
日前,迪士尼旧版米老鼠的版权正式过期,这意味着任何人都可以自由使用旧版米老鼠形象。 AI圈的开发者们手速也不可小觑,这不,才刚宣布过期没多久,他们就已经推出了米老鼠的SD模型Mickey-1928。 Mickey-1928是一个基于Stable-Diff...
-
探索Whisper语音识别
问题一:python多版本切换 背景:有了anaconda环境 还有一个c盘的不知道什么东西 我准备下载一个python3.9.9 去官网 然后安装,安装之前一定要把原来的python卸载干净。 3.9.9安装不上,我用3.10...
-
讯飞配音体验入口在哪 AI声音克隆软件推荐
讯飞配音是一款基于科大讯飞的人工智能语音技术的配音软件,它可以将文字转化为自然流畅的人声,支持多语种、多方言和中英混合,可灵活配置音频参数。讯飞配音的体验入口在哪呢,这里我们来看下讯飞配音的官方体验入口。 >>>点击前往 讯飞配音 官方...
-
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
IT之家 1 月 3 日消息,科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方面,对科研人员和科研机构、高等学校、医疗卫生机构、企业等(以下统称“...
-
AI修图小助手Inpaint wechat微信小程序上线 可选定图片区域进行消除修复
Inpaint_wechat 微信小程序已经上线了!这是一款基于微信AI能力的微信小程序,它可以实现图片选定区域的消除修复功能,并且是纯客户端实现,无需服务端的支持。 体验地址:https://top.aibase.com/tool/inpaint-we...
-
客观看待AI大模型在数字化转型中的地位和作用
“ AI大模型在数字化转型中的作用尚未突破《“以数据为中心的业务变革”之三种范式》中第三种范式的边界”。 自从OpenAI公司研发的机器人聊天程序ChatGPT在2022年11月30日发布以来,在全世界迅速带起了热潮。ChatGPT是AI大模型驱动的自...
-
2024年CIO的14项优先事项和趋势
GenAI将是2024年的最大技术趋势,也是董事会负责审查新工具、配置基础设施、准备应对新风险和利用新用户体验的CIO的优先事项。 这并不容易,因为大多数供应商都在添加新的GenAI功能,通常成本很高。CIO将需要为这些工具制定业务案例,以确定它们是能...
-
维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%
近日,来自斯坦福的研究人员发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人!...
-
Midjourney V6发布了,逼真画面登峰造极,不愧为最好的AI绘画
Midjourney V6昨天才说要来,下午就立马现身。速度之快,让人瞠目结舌!一系列惊艳绝伦的神奇图像纷纷爆出,光影效果简直达到了巅峰。尤其是他们主打的“你说得出,我就能画得出”。 Midjourney V6昨天下午突然发布了!Midjourney...
-
2024年八大关键技术趋势
1、更多的人将采用人工智能和机器学习 人工智能(AI 和机器学习(ML 不仅仅是流行语。我们日常使用的许多产品和服务的背后都是人工智能和机器学习,它们让我们的生活变得更轻松、更美好。 到2024年,许多风险投资家都在人工智能和机器学习上投入了大量资金,...
-
3 任务3 使用趋动云部署自己的stable-diffusion
使用趋动云部署自己的stable-diffusion 1 创建项目: 2 初始化开发环境实例 3 部署模型 4 模型测试 1 创建项目: 1.进入趋动云用户工作台,选择:当前空间,请确保当前所在空间是注册时系统自动生成的空间。 a...
-
肖仰华:走向千行百业的大模型
现如今,我们站在了大模型技术和产业发展的中场思考阶段。这个阶段的开启源于 ChatGPT 的诞生,它引发了广泛而深入的关注。尽管这种关注对于推动技术和产业的发展起到了至关重要的作用,但同时我们也看到了一系列问题的浮现。这些问题包括成本和价值的问题以及一些...
-
[AI绘画] 即插即用!SDXL+T2I-Adapters 高效可控的生成图片
标题:T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models 论文:https://arxiv....
-
配置 Stable Diffusion WebUI 纯 CPU 或核显绘画
(如有更新,见原文:https://blog.iyatt.com/?p=12345 1 前言 我笔记本电脑的独显上半年的时候烧掉了,所以只能用 CPU,折腾了一下午总算给配置出来了。我这里用的官方 Python,网上很多教程用 Anaconda(...
-
AIGC:【LLM(六)】——Dify:一个易用的 LLMOps 平台
文章目录 一.简介 1.1 LLMOps 1.2 Dify 二.核心能力 三.Dify安装 3.1 快速启动 3.2 配置 四.Dify使用 五.调用开源模型 六.接通闭源模型 七.在 Dify.AI 探索不同模型潜力 7.1 快速切...
-
使用Google大模型Bard(PaLM)理解时间序列预测模型ARIMA
使用Bard模型理解时间序列预测模型ARIMA Q: explains ARIMA model (注释:让Bard解释下时间序列预测模型ARIMA Q: explains the AR sub model in ARIMA model, gi...
-
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述
大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其...
-
ChatGPT、New Bing、文心一言、通义千问等 AI 工具到底哪个更AI? - 第二期
文章目录 前言 选手介绍 ChatGPT New Bing 文心一言 钉钉的文档AI 通义千问 文心一格 通义万相 测试开始 文案编写 ChatGPT New Bing 文心一言 钉钉的文档AI 通义千问 代码解读 ChatGPT...
-
美图AI视觉大模型MiracleVision奇想智能将向公众开放
1月2日,美图公司自研AI视觉大模型MiracleVision(奇想智能)通过《生成式人工智能服务管理暂行办法》备案,将面向公众开放。 美图AI视觉大模型MiracleVision(奇想智能)于2023年6月内测,为美图秀秀、美颜相机、Wink、美图设计室...
-
生成式人工智能泡沫将于2024年破灭
由于法律挑战、技术限制以及概念框架根本性转变的需要,生成式人工智能泡沫将在2024年破灭。 像ChatGPT这样的项目因其改变人类生活各个方面的潜力而闻名,但由于预期的破坏似乎难以捉摸,因此面临着审查。 随着技术行业寻求克服众多挑战,有必要进行重新调整...
-
FaceAiSwap官网体验入口 AI换脸服务免费使用地址
FaceAiSwap是一个先进的AI人脸交换服务,它允许用户将自己的脸部与喜欢的名人或朋友的脸部进行交换。使用这个服务非常简单:用户只需上传一张清晰的脸部照片,就能将自己的脸部替换到任何图片中。FaceAiSwap为免费用户每天提供 3 次免费交换机会。对...
-
年度最热AI应用TOP 50,除了ChatGPT还有这么多宝藏
百模齐发、AI工具乱杀的一年里,谁是真正赢家? ChatGPT访问量遥遥领先位居第一,但单次使用时长没超过平均线。 Midjourney访问量年度第四,但下滑量位居第二。 引爆AI绘画趋势的Stable Diffusion,年度访问量居然没进前20名?...
-
这是GPT-4变笨的新解释
变笨的本质是知识没进脑子。 自发布以来,曾被认为是世界上最强大的 GPT-4也经历了多场「信任危机」。 如果说今年早些时候那次「间歇式降智」与 OpenAI 重新设计 GPT-4架构有关,前段时间的「变懒」传闻就更搞笑了,有人测出只要告诉 GPT-4「现在...
-
突破Pytorch核心点,模型定义与搭建 !!
嗨,我是小壮! 咱们今儿来聊聊关于模型定义与搭建。很适合初学者! 在使用PyTorch进行深度学习时,首先需要了解的是如何定义和搭建模型。这块内容非常重要。 在PyTorch中,模型的定义通常通过创建一个继承自torch.nn.Module的类来完成。...
-
OpenVoice 官网体验入口 AI语音克隆软件app免费下载地址
OpenVoice是一个开源的语音克隆技术平台,能够准确克隆参考音色,生成包含多种语言和口音的语音。它的核心功能在于能够灵活控制语音风格,如情感、口音、节奏、停顿和语调等参数。此外,OpenVoice实现了零样本跨语言语音克隆,这意味着生成的语音和参考语音...
-
【个人首测】百度文心一言 VS ChatGPT GPT-4
昨天我写了一篇文章GPT-4牛是牛,但这几天先别急,文中我测试了用GPT-4回答ChatGPT 3.5 和 Notion AI的问题,大家期待的图片输入也没有出现。 昨天下午百度发布了文心一言,对标ChatGPT,录屏+无实机演示让百度股价暴跌。...
-
Hyena成下一代Transformer?StripedHyena-7B开源:最高128k输入,训练速度提升50%
最近几年发布的AI模型,如语言、视觉、音频、生物等各种领域的大模型都离不开Transformer架构,但其核心模块「注意力机制」的计算复杂度与「输入序列长度」呈二次方增长趋势,这一特性严重限制了Transformer在长序列下的应用,例如无法一次性处理一...
-
【AI绘画】如何使用Google Colab安装Stable Diffusion
【AI绘画】如何在Colab安装的Stable Diffusion 背景 准备 安装 查看资源仓库 跳转到Colab 运行`Stable Diffusion` 基础设置 启动运行 访问Stable Diffusion WebUI界面 模...
-
ComfyUI实用插件Plush-for-ComfyUI 可在ComfyUI中调用GPT-4和DALL-E3
Plush-for-ComfyUI插件是一个非常有趣的工具,它可以在ComfyUI平台中调用GPT-4和DALL-E3,实现从图片提取提示词并使用DALL-E3在ComfyUI中生成图片。 项目地址:https://top.aibase.com/tool...
-
苹果与新闻出版商谈判付费训练AI模型,此前微软和OpenAI已被起诉
据报道,苹果已经开始与几家国际出版商进行谈判,以获取他们的新闻材料,用于训练和开发AI模型。据悉,苹果拟花费大约5000万美元,寻求包括IAC、Conde Nast和NBC News在内的国际媒体机构授权此类内容。 业内预计,此举将帮助苹果赶超在AI竞...
-
【AI绘画】Stable Diffusion学习——安装与使用教程(一)
一、 安装前准备 1、Python 官网:https://www.python.org/downloads/ 建议安装3.10开头的版本号,下载安装包后运行即可 (安装python,建议安装3.10.6版本,这个是Stable Diffusion We...
-
ChatGPT付费版来啦,好用的AI生成产品还能免费使用吗?AIGC工具箱
最新消息,chatGPT推出了付费版!每月$42美元,不限流使用,你会付费使用吗? ?AIGC工具箱 下面推荐几款AI 生成产品! 你觉得哪个更好用呢? AI 的出现,颠覆了内容生产的方式,在有的人还在从 0 开始学习作图软件...
-
OpenAI再出新作,AIGC时代,3D建模师的饭碗危险了!
大家好,我是千与千寻,也可以叫我千寻哥,说起来,自从ChatGPT发布之后,我就开始焦虑,担心自己程序员的饭碗会不会哪天就被AIGC取代了。 有人说我是过度焦虑了,但是我总觉有点危机感肯定没有坏处。(结尾反转,hhh,希望你看下去!) 不过好家伙,还没...
-
stable-diffusion-webui 安装采坑日记
这里写自定义目录标题 安装容易采坑的点 效果测试 安装容易采坑的点 1、不愿安装大佬的整合包。在自己时间足够多的情况下,可以尝试自己搭环境。但是自己安装的时间成本真的非常高,环境配置报错会让人陷入崩溃,如果没有代码排错能力,还是建...
-
Stable-diffusion WebUI API调用方法
写这篇文章的主要原因是工作中需要写一个用训练好的模型批量生图的脚本,开始是想用python直接加载模型,但后来发现webui的界面中有很多用起来比较方便的插件和参数,最终改成调用WebUI接口的方式来批量生图。 Stable-diffusion的webu...
-
CodeGeeX、CodeWhisperer、Github Copilot三款AI辅助编程工具,程序员该如何选择?
亚马逊今天在Re:Mars大会上宣布推出CodeWhisperer,这是一款类似于CodeGeeX和GitHub Copilot的AI辅助编程工具,它根据一个注释或几个按键来自动补全整个函数。目前支持Java、JavaScript和Python,和Code...
-
Midjourney之外21款免费的AI Image画图网站集合
目前火热的Midjourney在艺术界如日中天,除此之外还有哪些免费好用的AI Art方向的网站呢?我们做了一些整理,一共21个免费的网站,全部收录到 webhub123 免费的21个 AI Art网站集合https://www.webhub123.co...
-
Stable Diffusion替换背景
在Stable Diffusion软件中,使用ControlNet+模型实现固定物体批量替换背景 出图的流程。 一、准备好图片 1.你需要准备好一些白底图或者透明底图用于训练模型。 ...
-
一文通透位置编码:从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long
前言 关于位置编码和RoPE 应用广泛,是很多大模型使用的一种位置编码方式,包括且不限于LLaMA、baichuan、ChatGLM等等 我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的,一篇是关于transformer从零实现...
-
〔011〕Stable Diffusion 之 解决绘制多人或面部很小的人物时面部崩坏问题 篇
✨ 目录 ▷ 脸部崩坏 ▷ 下载脸部修复插件 ▷ 启用脸部修复插件 ▷ 插件生成效果 ▷ 插件功能详解 ▷ 脸部崩坏 相信很多人在画图时候,特别是画...
-
GPT-5不会真正突破,24年AGI不会实现!全网AI大佬24年最全预测
【新智元导读】经过23年的生成式AI之年,24年AI会有哪些新突破?大佬预测,即使GPT-5发布,LLM在本质上仍然有限,在24年,基本的AGI也不足以实现。 23年是当之无愧的「生成式AI之年」。 24年,AI技术会有哪些突破? 英伟达高级科学家Jim...
-
【AI绘画打卡】| 用漫画生成器绘制宅男最爱的二次元美女
二次元美女在日本文化中已经成为一种流行文化和艺术形式,包括漫画、动画等。由于此类作品的富有想象力、多样性和虚构,像二次元美女这样的虚拟角色往往可以充分满足人们的幻想和情感需求。这也是许多宅男在二次元世界寻找自己理想女友的原因之一。 作品参考(附关键词)...