-
2024大模型应用元年,科大讯飞率先打响商业化第一枪
浩浩荡荡的AIGC潮流,叠加资本资金如火如荼地注入,过去一年里,AI赛道焕发了新生,再度登上了科技语境的浪潮之巅。 然而,与大模型战场的热闹相比,在商业化落地场景,AIGC的步伐却略显踌躇——技术层面,从文字到图像创作再到视频创作,AI屡屡交出了刷新大众视...
-
【深度学习】AIGC ,ControlNet 论文,原理,训练,部署,实战,教程(一)
论文:https://arxiv.53yu.com/pdf/2302.05543 代码:https://github.com/lllyasviel/ControlNet 得分几个博客完成这个事情的记录了,此篇是第一篇,摘录了一些论文内容。ControlN...
-
GitHub Copilot使用方法
大家好,我是升仔 引言 GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它通过理解代码的上下文,自动提供代码补全建议,大大提高编程效率。接下来,我将介绍如何使用GitHub Copilot,并提供一...
-
Android 拍照以及相册中选择(适配高版本)————上传头像并裁剪(一)
前言 在项目研发中,相信大家都遇到过给用户增加头像照片的需求。 随着手机版本的不断更新,android 8、android 9、android 10、android 12、android 13、鸿蒙系统等等;遇到这个功能需...
-
编程新范式,当Spring Boot遇上OpenAI
2023年,AI技术已经成为一个热点话题,影响了许多领域,特别是编程领域。人们越来越意识到AI技术的重要性,包括Spring社区在内。 随着GenAI(I(General Artificial Intelligence))技术的不断发展,简化具有AI功能...
-
Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。简单的说,Mobile-Agent相当于一个可以模拟人类操作手机的自主多模态AI代理。 该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要...
-
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2022年,Stable Diffusion模型横空出世,其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,让AI再次性感。 Stable Diffusion是计算机视觉领域的...
-
Vision Pro大卖50亿小扎狂喜!Meta烧光500亿,VR复兴的希望来了
根据外媒曝料,2月2日正式发售之前,苹果的Vision Pro已经销售已经达到20万台,销售金额突破50亿美元! 图片 虽然对于苹果帝国巨大的体量来说,这个数字简直不值一提,但至少说明,消费者是愿意为这个3500刀的玩具买单的。 Vision Pro的媒...
-
人人可参演贾玲新电影!《热辣滚烫》联合支付宝推出AI新玩法
1月31日,春节档新片宣发战火热之际,贾玲新电影《热辣滚烫》正式联合支付宝,在五福期间推出全新AI互动玩法:用户上支付宝搜索「小剧场」自主上传照片,就可以通过AI科技,获得“参演”贾玲新电影的专属片段。 电影《热辣滚烫》出品方、新丽传媒副总裁王乔介绍,《...
-
【探索科技 感知未来】文心一言大模型
【探索科技 感知未来】文心大模型 ?本文介绍 文心一言大模型是由中国科技巨头百度公司研发的一款大规模语言模型,其基于先进的深度学习技术和海量数据训练而成。这款大模型具备强大的自然语言处理能力,可以理解并生成自然语言,为用户提供自然、流畅的语言交...
-
AI绘画风格化实战
在社交软件和短视频平台上,我们时常能看到各种特色鲜明的视觉效果,比如卡通化的图片和中国风的视频剪辑。这些有趣的风格化效果其实都是图像风格化技术的应用成果。 风格化效果举例 MidLibrary 这个网站提供了不同的图像风格,每一种都带有鲜明的特色。M...
-
CoPilot究竟如何使用?
基本步骤说明 CoPilot是一款由GitHub开发的人工智能代码助手,可以提供实时代码建议和自动完成功能。下面是使用CoPilot的详细介绍: 安装:首先,你需要在你的代码编辑器中安装CoPilot插件。目前,CoPilot支持一些主流的代码编辑...
-
AIGC教育行业全景报告:AI助教和家教成真,学习机迎来新机遇
经过一年的快速迭代,业内对于生成式AI将会率先落地于哪些行业已经有了答案。 教育领域,不仅被OpenAI列为重点应用之一,也成为国内大模型厂商布局的重点方向。 生成式AI技术发展的背后,反映出人类与大模型交互的不断精进。大模型在训练过程中不断学习人类的思...
-
GPTsApp官网体验入口 GPTs人工智能应用商店在线使用地址
GPTs App是一个创新的人工智能应用商店,专注于提供定制的 ChatGPT 应用。通过集成 OpenAI 的先进技术,GPTs App致力于推荐和排名各类GPTs,以满足用户在内容创作、教育、效率提升、讲故事、搜索引擎优化和数据分析等多种场景的需求。...
-
Midjourney使用教程:三 图片风格提示
这里我根据现在的官方文档来继续我们的Midjourney的教程,看到这里如果你去实践的话,估计你已经有了好多张属于自己的图片。 这时候你不在满足简单的提示生成的Midjourney的默认风格图片,实际上你可以通过一些关键词做提示,来改变输出的图片风格,像...
-
AI虚拟陪伴聊天应用如此火爆,为什么没有中国版Character.ai出现?
三句话,让生气的AI恋人原谅我。 最近,一款名为“哄哄模拟器”的AI聊天产品突然走红。 与单纯提供陪伴、情绪价值的AI聊天应用不同,哄哄模拟器更像是一个练习高情商对话的小游戏。 游戏内预设了多种常见的情侣吵架场景,包括但不限于: 你需要想方设法在限...
-
Copilot in Power BI详细使用说明
1、获取账号 请先参考: Copilot in Power BI等了好久终于等到今天 官网订阅接近4万元/月,在这里100元/月 2、获取账号后,用初始密码登录powerbi首页 https://app.powerbi.com/ 强制修改密码,...
-
使用Transformer 模型进行时间序列预测的Pytorch代码示例
时间序列预测是一个经久不衰的主题,受自然语言处理领域的成功启发,transformer模型也在时间序列预测有了很大的发展。本文可以作为学习使用Transformer 模型的时间序列预测的一个起点。 数据集 这里我们直接使用kaggle中的 Store...
-
Windows 11 大更新:Copilot 终于来临, 全面接入 GPT-4
2023年6月30号,微软终于在6月最后一天推出的开发者预览版更新,支持Windows Copilot。这次更新没有延迟,可算是互联网界的一股清流。接下来,我们来看一下Windows Copilot能够实现什么功能。 上个月,软总裁萨蒂亚·纳德拉(S...
-
Unity3d引擎中使用AIGC生成的360全景图(天空盒)
前言 在这里与Skybox AI一起,一键打造体验无限的360°世界,这是这个AIGC一键生成全景图的网站欢迎语。 刚使用它是23年中旬,在没有空去给客户实地拍摄全景图时,可以快速用它生成一些相关的全景图,用作前期沟通的VR demo。当时使用所有都...
-
【AIGC】从零手写一个GPT
手写一个GPT 在GPT,确切的说是Transformer,出现之前,一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。 比如我们有两句话 我喜欢你 吾中意你 它们作为句子内容并不一样,但是表达的含义却...
-
比亚迪发布璇玑AI大模型;微软推出Copilot Pro;国内首个MoE模型上线
比亚迪发布璇玑 AI 大模型 1 月 16 日,在 2024 比亚迪梦想日活动上,比亚迪正式发布了整车智能化架构「璇玑」及「璇玑 AI 大模型」。 比亚迪产品规划及汽车新技术研究院院长杨冬生称,「璇玑」是行业首个智电融合的智能化架构,让汽车拥有...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
OpenAI最新功能:多GPTs协同工作 @谁,谁出来干活
OpenAI最新推出的功能引起了广泛关注,该功能允许用户在对话中@不同的GPT,实现多个GPT协同配合完成任务。这一改动可能带来的影响是巨大的,人们使用AI的工作流程可能就此改变,人们自己的工作方式也可能就此改变。 这一功能使得使用GPT的方式更加中心化,...
-
RAG高阶技巧-如何实现窗口上下文检索
在本文中,我们将介绍一种提高RAG(Retrieval-Augmented Generation)模型检索效果的高阶技巧,即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题,然后介绍窗口上下文检索的原理和实现方法,最后通过一个实例展...
-
开源一个整合了AIGC大语言模型的SpringBoot智慧医药系统
前言 哈喽兄弟们,好久不见哦~ 最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的,虽然这些项目普遍都写的比较简单,但想一想既然放在电脑里面也吃灰,那么还不如开源分享出去,没准还可以帮助到一些小白新手。 本期就在其中选取了一个医...
-
大语言模型部署:基于llama.cpp在Ubuntu 22.04及CUDA环境中部署Llama-2 7B
llama.cpp是近期非常流行的一款专注于Llama/Llama-2部署的C/C++工具。本文利用llama.cpp来部署Llama 2 7B大语言模型,所采用的环境为Ubuntu 22.04及NVIDIA CUDA。文中假设Linux的用户目录(一般为...
-
Apple:使用语言模型的自回归方式进行图像模型预训练
1、背景 在GPT等大模型出现后,语言模型这种Transformer+自回归建模的方式,也就是预测next token的预训练任务,取得了非常大的成功。那么,这种自回归建模方式能不能在视觉模型上取得比较好的效果呢?今天介绍的这篇文章,就是Apple近期发...
-
首届百度商业AI技术创新大赛启动 点燃AIGC革新“星火”
随着生成式AI在全球范围的热议,AIGC前沿技术也在快速迭代,正如百度CEO李彦宏所说 “人工智能发生了方向性改变,从辨别式AI走向生成式AI,生成式AI会带来极大的效率提升” 。而这一领域的发展,将推动AI产品应用深化,极有可能在内容创作、客户服务等领域...
-
webassembly003 whisper.cpp的项目结构CMakeLists.txt
注:带星号的为非重要部分 基础配置 cmake_minimum_required (VERSION 3.5 project(whisper.cpp VERSION 1.5.0 # Add path to modules list(APPEND...
-
Mac安装Stable Diffusion
第一步:安装anaconda https://www.anaconda.com/download 第二步:下载代码 # 创建虚拟环境sdtest1 conda create -n sdtest1 python=3.10 # 激活虚拟环境sdtest1...
-
利用 “diart“ 和 OpenAI 的 Whisper 简化实时转录
利用 "diart" 和 OpenAI 的 Whisper 简化实时转录 工作原理 Diart 是一个基于人工智能的 Python 库,用于实时记录说话者语言(即 "谁在什么时候说话"),它建立在 pyannote.audio 模型之上,专为实时音频流...
-
记录Stable-Diffusion-Webui 在Windows11的Anaconda环境下的避坑安装
#记录工作,工作复盘 仅作记录,未尽之处请补充,谢谢! 电脑配置情况大致记录如下,请参考: MSI移动工作站,64G内存,4GB显存 一、安装前准备: 阅读文档,明确软件依赖和安装要求: 在用Anaconda环境下安装stable-diff...
-
stable diffusion代码学习笔记
前言:本文没有太多公式推理,只有一些简单的公式,以及公式和代码的对应关系。本文仅做个人学习笔记,如有理解错误的地方,请指出。 本文包含stable diffusion入门文献和不同版本的代码。 文献资源 本文学习的代码; 相关文献: D...
-
Stable Diffusion 硬核生存指南:WebUI 中的 CodeFormer
本篇文章聊聊 Stable Diffusion WebUI 中的核心组件,强壮的人脸图像面部画面修复模型 CodeFormer 相关的事情。 写在前面 在 Stable Diffusion WebUI 项目中,源码 modules 目录中,有一个有趣...
-
无独立显卡电脑安装Stable Diffusion教程,附安装包
Stable Diffusion是一款开源的人工智能绘图工具。能通过文本生成精美的图片。 视频演示: 大叔试用人工智能 无独立显卡如何安装StableDiffusion 看一下Stable Diffusion生成的图片样例:...
-
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据...
-
AIGC:Prompt逆向工程简介及使用
很多同学都会写爬虫。但如果想把爬虫写得好,那一定要掌握一些逆向技术,对网页的JavaScript和安卓App进行逆向,从而突破签名或者绕过反爬虫限制。最近半年,大语言模型异军突起,越来越多的公司基于GPT3.5、GPT-4或者其他大语言模型实现了各种高级功...
-
多模态大模型,阿里通义千问能和GPT-4V掰手腕了
通义千问的图像推理能力,最近有了大幅提升。 2024年,大模型领域要卷什么? 如果没有思路的话,不妨看看各家大厂都在押注什么方向。 最近一段时间,先是 OpenAI 推出 GPT-4V,让大模型拥有了前所未有的图像语义理解能力。 谷歌随后跟上,发布的 G...
-
聚观早报 |苹果官网大促销;微软开放AI助手Copilot
聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 1月17日消息 苹果官网大促销 微软开放AI助手Copilot vivo X100 Ultra影像规格曝光 智谱A...
-
FaceSwapper有哪些换脸功能 AI换脸在线免费软件推荐
FaceSwapper 是一款免费的在线 AI 换脸软件,可让您将一张脸换到另一张脸上。该软件使用深度学习来实现换脸,效果非常逼真。FamousFace的体验下载入口在哪呢,这里我们来看FamousFace的官方体验入口。 >>>点击前...
-
微软人工智能办公AI工具 Copilot Pro 11项 Copilot 功能
Copilot(曾用名 Bing Chat 和 Bing Chat Enterprise)在此期间成为了许多用户的日常AI伴侣,并在正式发布后将继续为用户提供AI驱动的网络聊天体验。 微软Copilot官方网址链接:Microsoft Copil...
-
甲骨文变身“AI狂战士”,MySQL、Java、OCI,一切技术栈火力全开,猛战AI!
撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 太猛了!甲骨文已经按捺不住,就像找了某种魔法钥匙一般,准备在2024年大干一场! 近日,甲骨文宣布正在将生成式AI功能集成到该公司的整个云服务OCI(Oracle Cloud In...
-
中文性能反超VLM顶流GPT-4V,阿里Qwen-VL超大杯限免!看图秒写编程视觉难题一眼辨出
【新智元导读】多模态大模型将是AI下一个爆点。最近,通义千问VLM模型换新升级,超大杯性能堪比GPT-4V。最最重要的是,还能限时免费用。 最近,通义千问实火。 前段时间被网友玩疯的全民舞王,让「AI科目三」频频登上热搜。 让甄嬛、慈禧、马斯克、猫主子和兵...
-
阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V
阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。 Qwen-VL-Max模型在视觉推理方面展现出卓越的能力,可以理解并分析复杂的图片信息,包括识人、答题、创作和写代码等任务。此外,该模型还具备视觉定位功能,可根据画面指定区域...
-
AI应用自动化构建平台VectorShift 通过无代码界面构建自动化工作流
YC昨天投的那家公司,VectorShift,是一家AI应用自动化构建平台。他们利用人工智能来搜索知识库、生成文档并部署聊天机器人和助手,以帮助任何组织构建企业级AI应用程序。 这家公司通过拖放支持组件来完成各种任务,比如连接不同的节点,如LLM、数据加载...
-
零基础入门AI绘画神器Stable Diffusion保姆级别教程!!小白必收藏!!!
手把手教你入门绘图超强的AI绘画程序Stable Diffusion,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新Stable Diffusion保姆级教程资料包(文末可获取) 一、本地部署 Stable diffusion...
-
stable diffusion在server上的部署测试
SD infinite canvas Automatic1111 vs InvokeAI Automatic1111 vs InvokeAI - pros and cons stablediffusion-infinity 该repo的问题是已...
-
PIXGEN官网体验入口 AI图片处理工具免费在线试用地址
PIXGEN是一款基于人工智能技术的先进在线图片处理工具,为用户提供一键换脸、背景模糊、抠图、智能美图等多项功能。通过集成当前最优秀的深度学习模型,PIXGEN保证了图片处理效果,并提供多种灵活的付费模式,以满足不同用户的需求。 点击前往PIXGEN官网...
-
一文读懂Stable Diffusion 论文原理+代码超详细解读
背景 Stable diffusion是一个基于Latent Diffusion Models(LDMs)实现的的文图生成(text-to-image)模型。 2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院(Théâtre...