-
【小沐学Python】Python实现语音识别(Whisper)
文章目录 1、简介 1.1 whisper简介 1.2 whisper模型 2、安装 2.1 whisper 2.2 pytorch 2.3 ffmpeg 3、测试 3.1 命令测试 3.2 代码测试:识别声音文件 3.3 代码测试:...
-
百度灵境矩阵升级为文心大模型智能体平台
百度的灵境矩阵平台升级为文心大模型智能体平台,为开发者提供多样化的开发方式,支持开发者根据自身领域和应用场景,选择不同的开发方式,打造大模型时代的应用。 灵境矩阵的智能体升级降低了智能体的开发门槛,开发者可以通过自然语言交互的方式低成本高效率地开发智能体...
-
无脑利用API实现文心一言AI对话功能?(附代码)
前言:在当今数字化的时代,人工智能(AI)技术正在不断演进,为开发者提供了丰富的工具和资源。其中,API(应用程序接口)成为构建强大AI应用的关键组成部分之一。本文将介绍如何利用API来打造一个AI对话网站,使用户能够与智能系统进行交互。 以下内容不作太...
-
生物技术打开新大门:AI 可设计出具有非凡结合强度的蛋白质
12 月 20 日消息,华盛顿大学医学院蛋白质设计研究所的科学家利用人工智能软件,设计创建出一批具有非凡结合强度的蛋白质分子。 这些分子与包括人类激素在内的各种生物标志物具有极高的亲和力和特异性,而且有些分子与其目标之间实现了迄今最高的相互作用强度。...
-
前OpenAI首席科学家Ilya: 只要能够预测下一个token,人类就能达到AGI
近日,Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。 这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」,似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...
-
李飞飞吴恩达等2024年AI十大预测 AI智能体将在一年内大爆发
2024年AI的发展将迎来全球普及,比尔盖茨、李飞飞、吴恩达等领袖对此有不同的见解。比尔盖茨强调AI将在3年内彻底席卷全球,提出了对抗抗生素耐药性、个性化导师、治疗高危妊娠等领域的期望,并呼吁产品适合使用者。 吴恩达则对AI监管提出异议,认为现行监管措施...
-
「校园Pie」第二站赴上海科技大学:共同探讨大模型如何助力企业智能决策
PieCloudDB 社区校园行系列活动「校园 Pie」旨在促进产学研合作,提供一个与高校交流的平台。通过分享行业动态与前沿技术、产业界案例与应用以及云原生数据库技术的应用与实践等内容,帮助学生了解最新的数据库发展趋势和相关技术应用。「校园 Pie」第二站...
-
三星 Galaxy S24 Ultra 预计搭载强化夜间模式和 200 MP AI 优化相机
预计三星将于明年 1 月中旬推出 Galaxy S24 系列手机,其中 S24 Ultra 将成为该公司有史以来最佳的相机手机。 根据最新报道,Ultra 的夜间模式将得到改进,同时新的 200 MP 模式将具备 AI 优化功能。知名爆料人 Ice Un...
-
Stable Diffusion - Stable Diffusion WebUI 支持 SDXL 1.0 模型的环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132056980 SDXL 1.0 版本 是 Stable Dif...
-
线路规划,寻路算法介绍及代码实现
寻路算法是计算机图形学和人工智能领域中常用的算法之一,用于计算从一个点到另一个点的最短路径或最优路径。在本文中,我将详细介绍两种常用的寻路算法:Dijkstra算法和A*算法。 Dijkstra算法 Dijkstra算法是一种广度优先搜索算法,用于寻找...
-
华为盘古大模型预测台风未来路径只要10秒 以前5小时
快科技12月20日消息,华为联合泰国数字经济与社会部举办2023年泰国华为云AI峰会。 峰会中,双方签署了数字化转型合作谅解备忘录,华为承诺将推动泰国数字化转型,助力泰国成为区域的AI中心枢纽。 本次峰会,华为云解决方案销售部总裁陈亮发布了政务大模型、泰语...
-
AIGC大记事【2023-0625】【第五期】:《时代》专访ChatGPT之父:人工智能影响经济还需要很多年
大咖观点: 《时代》专访ChatGPT之父:人工智能影响经济还需要很多年 孙正义:我每天和ChatGPT聊天,一场巨大革命即将到来,软银“终将统治世界!” 刘慈欣谈 ChatGPT:人类的无能反而是人类最后的屏障 AI时代已来,吴恩达呼吁向每个孩...
-
MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT
MosaicML正在推出其第二个开源大型语言模型(LLM),称为MPT-30B,这是继五月份首次推出的较小的MPT-7B模型之后。 为了讨论新模型及其对开发人员的意义,我采访了MosaicML联合创始人兼首席执行官Naveen Rao。他之前的创业公司是...
-
“文心一言”对标“ChatGPT”有几层功力?
2023年3月16日下午,我们的“李总”宣布文心一言正式发布。 在“李总”的介绍中指出,文心一言具有文学创作,商业文案的创作,多模态生成,数理逻辑推算,中文理解等能力。从现场的展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性,逻...
-
AI绘画工具汇总
欢迎来到魔法宝库,传递AIGC的前沿知识,做有格调的分享❗ 喜欢的话记得点个关注吧! 目前市面上的AI绘画工具十分繁杂,以下工具可供参考: 1. Midjourney 添加图片注释,不超过 140 字(可选) Midj...
-
文心一言4.0使用指南
文心一言4.0使用指南 在线体验:体验地址 一、文心一言能力如何 不管百度公司如何,就AI大模型来说,文心一言和其他国内产品相比,还是具有相当大的优势的,可以说是在个人的使用方面,我认为是最顶级的。 但是和ChatGPT4相比,确实还是有很大的...
-
Stable Diffusion Webui 之 ControlNet使用
一、安装 1.1、插件安装 1.2、模型安装 模型安装分为预处理模型和 controlnet所需要的模型。 先安装预处理模型,打开AI所在的安装目录\extensions\sd-webui-controlnet\annotator,将对应的预...
-
CentOS安装Whisper | RedHat安装Whisper | 服务器上安装Whisper
1、升级Python版本(可选) CentOS 7.9 系统默认安装的Python版本有两个,如果输入python -V我们看到的是python2的版本信息,如果我们输入python3 -V我们看到的是python3的版本信息。 由于whisper要...
-
专为大模型打造!摩尔线程发布智算加速卡MTT S4000:支持48GB显存
快科技12月19日消息,今天,摩尔线程发布了全新智算加速卡MTT S4000,训推兼顾专为大模型打造,单卡支持48GB显存。 据介绍,MTT S4000采用了第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽,FP32性能为25TFLOPs...
-
基于云的生成式AI,自己构建,还是购买?
作者 | David Linthicum 编译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 技术圈有一个不传的事实:大家都喜欢使用他人的技术。然而,对于许多企业而言,生成式人工智能似乎并未遵循这一模式。 生成式 AI 正在推动一...
-
微信进一步规范“自媒体”内容来源标注 需标注内容由AI生成等
微信官方发文称,根据《关于加强“自媒体”管理的通知》(以下简称《通知》)要求,“自媒体”账号在发布涉及国内外时事、公共政策、社会事件等相关信息时,应准确标注信息来源,发布时在显著位置展示。 微信公众平台致力于打造绿色、健康的平台生态,不断提升平台内容的安全...
-
研究团队开发开源大模型训练框架 Oobleck 提供快速且有保障的故障修复
随着对生成式人工智能技术需求的激增,大型语言模型的训练和容错性要求也在不断增加。为应对这一挑战,密歇根大学的研究人员开发了一款名为Oobleck的开源大型模型训练框架。该框架采用管道模板的概念,为大型模型的预训练提供了快速而可靠的故障恢复机制。 项目地址...
-
2024 年八大生成式 AI 工具类别
需要为组织的开发项目提供特定于生成式 AI 的工具?探索这些工具所属的主要类别及其功能。 ChatGPT 等生成式AI 服务的普及激发了将这些新工具应用于实际企业应用的兴趣。如今,几乎每个企业应用程序都通过生成式 AI 功能进行了增强。 大多数 AI、...
-
BlueLM蓝心大模型测试体验入口 热门手机AI大模型推荐
BlueLM蓝心大模型是vivo AI全球研究院自主研发的大规模预训练语言模型,具有 70 亿模型参数量,能处理32K上下文长度。它基于260TB的多语言训练语料,提供了强大的语言理解能力,并可广泛应用于内容创作、知识问答、逻辑推理、代码生成等场景,持续为...
-
科研神器:Vscode + latex+grammarly+github copilot
科研论文编写神器:Vscode + latex + grammarly + github copilot 相信很多科研人都有使用latex排版及撰写论文的需求,我一开始使用的是在线编辑的overleaf,overleaf的优点是省事便捷,不用配置,并且...
-
AI、零信任、边缘现代化与多云,2024这些技术趋势值得关注
事实上,在这场由ChatGPT激起的新一轮AI浪潮中,全球科技巨头、AI厂商、行业翘楚等纷纷下场,唯恐错过此番科技盛宴。同时,GenAI蓬勃发展产业规模也在高速增长,麦肯锡调查数据显示,2022年GenAI市场收入为400亿美元,预计2027年及203...
-
掌趣科技:AI游戏创作平台还在加紧开发过程中
掌趣科技在12月18日的互动平台上宣布,公司已与北京悠米互动娱乐科技有限公司达成业务合作,共同开发AI游戏创作平台。该平台旨在降低开放世界游戏的开发门槛,让个人和小团队也能开发大规模的开放世界游戏,并通过该平台分享游戏成果,实现AI+UGC。 作为创新性较...
-
通俗理解DDPM到Stable Diffusion原理
?关注公众号funNLPer畅度阅读? 代码1:stabel diffusion 代码库 代码2:diffusers 代码库 论文:High-Resolution Image Synthesis with Latent Diffusion Mo...
-
AI绘画人像promt分享
Promt Checkpoint为基础模型,常用chilloutmix和majicmixRealistic 在设置好checkpoint后,即可设置promt,按照经验来说, promt=Base promt+Description promt+lo...
-
EmbedAI:允许用户使用自己的数据来训练ChatGPT
EmbedAI是一个创新平台,允许用户使用自己的数据来训练ChatGPT,并将其嵌入到自己的网站或应用中。这个平台支持在各种数据源上训练ChatGPT,包括文件、网站、Notion文档甚至YouTube。 官网地址:https://www.thesamu...
-
谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐
谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作,提出了一种名为PixelLLM的智能模型,旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发,尤其是婴儿描述其视觉环境的方式,包括手势、指向和命名。 Pix...
-
越来越像人类的AI,提前过起「圣诞节」
ChatGPT,居然会偷懒? 在许多文学作品的描述中,AI都是不知疲倦、不用休息,可以007工作的超级工具,而强大的人工智能甚至可以像人类一样自主思考、拥有情感。虽然目前的AI模型,还远不及科幻电影中的强人工智能,但是表现也远超以前的“人工智障”。 有意思...
-
一)Stable Diffusion使用教程:安装
目前AI绘画最火的当属Midjorney和Stable Diffusion,但是由于Midjourney没有开源,因此我们主要分享下Stable Diffusion,后面有望补上Midjourney教程。 本节主要讲解Stable Diffusion...
-
Microsoft 365 Copilot正式上线,如何稳定访问体验?
如果将微软对人工智能的投资看成一场豪赌,Microsoft Copilot无疑是现阶段最受瞩目的赌注。2023年9月正式发布的Microsoft Copilot是一种基于大型语言模型(LLM)和微软图形(Microsoft Graph)的数据和人工智能(A...
-
什么是AWS CodeWhisperer?
AWS CodeWhisperer https://aws.amazon.com/cn/codewhisperer/ CodeWhisperer 经过数十亿行代码的训练,可以根据您的评论和现有代码实时生成从代码片段到全函数的代码建议。...
-
[Stable Diffusion进阶篇]教你制作 SD 光影文字
在艺术二维码之后,光影文字又开始火起来了。本篇怎么利用 Stable Diffusion 的 ControlNet 插件来制作光影图片。 1.下载光影模型组件 1.SD主模型:majicMIX realistic V6、xxmix9realistic_...
-
使用Llama.cpp在CPU上快速的运行LLM
大型语言模型(llm 正变得越来越流行,但是它需要很多的资源,尤其时GPU。在这篇文章中,我们将介绍如何使用Python中的llama.cpp库在高性能的cpu上运行llm。 大型语言模型(llm 正变得越来越流行,但是它们的运行在计算上是非常消耗资...
-
剪映Dreamina测试入口在哪 抖音AI剪辑软件推荐
剪映Dreamina是一款由抖音推出的图片创作工具,属于AIGC的领域。用户可以根据一段文案,生成四幅由AI创造的图片,这些图片有不同的风格和主题。用户还可以对生成的图片进行编辑,包括调整图片的比例和选择不同的模板类型。剪映Dreamina软件的体验入口在...
-
基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化
基于隐空间的扩散模型 (Latent Diffusion Model ,是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例,广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始,多次去...
-
腾讯云推出高性能应用服务HAI,让每个开发者都能开发自己的AI应用
降低AIGC应用开发门槛,才能更快发现下一个AIGC现象级应用。 12月18日,腾讯云宣布推出高性能应用服务(Hyper Application Inventor,HAI ,用户无需复杂配置,最快10分钟即可创建自己的AI应用。 HAI能够提供即插即用的...
-
Gemini官网体验入口 谷歌AI聊天模型软件app免费下载地址
Gemini是由谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域的表现超越了以往,成为目前最强大的AI系统之一。它有三个不同规模的版本,能...
-
Stable Diffusion 的提示词使用技巧
推荐Stable Diffusion自动纹理工具: DreamTexture.js自动纹理化开发包 什么是提示语? 提示语是人工智能中的一个重要组成部分,尤其是自然语言处理 (NLP)。在AI自人工智能中,想要获得好的效果,简洁、准确的提示语尤...
-
Gemini自曝中文用百度文心一言训练,网友看呆:大公司互薅羊毛??
谷歌Gemini中文语料疑似来自文心一言??? 先是有读者向我们爆料: 在谷歌Vertex AI平台使用该模型进行中文对话时,Gemini-Pro直接表示自己是百度语言大模型。 很快,有微博大V@阑夕夜也发博称: 在Poe平台上对Gemini-Pro进行...
-
OpenAI「登月计划」剑指超级AI!LeCun提出AGI之路七阶段,打造世界模型是首位
通用AGI,或许近在咫尺。 OpenAI下一步「登月计划」,就是实现人类期待已久的超级人工智能,而到达这一步的前提是——解决超级AI对齐问题。 就在前几天,首席科学家Ilya带头OpenAI超级对齐团队取了的实质性成果。他们发表的最新论文,首次确定了超...
-
思科发布最新研究报告,企业在人工智能就绪方面存在巨大差距
新闻摘要: 98%的中国企业表示,在过去六个月中,部署人工智能技术的紧迫性有所增加。 在战略、基础设施、数据、治理、人才和文化六大关键业务支柱上,91%的企业表示他们还没有完全准备好将人工智能整合到业务运作中。 64%的受访者表示,他们最多只有一年的时...
-
AI视频生成软件pika创始人是谁 Pika官网体验入口
Pika 1. 0 是Pika Labs最新推出的AI视频生成工具,它标志着视频创作领域的一个新时代。这款工具以其“从想法到视频”的模型,能够将普通内容转变为非凡的视觉作品。它能无缝处理文本、图片、视频片段甚至实体对象,为每个元素注入新生。想了解更多关于P...
-
速度暴涨1000倍!扩散模型预测材料“炼金”过程,体系越复杂加速度越大
用扩散模型预测化学反应,速度直接暴涨1000倍! 原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。 这是MIT和康奈尔大学联合搞出来的一项新研究,用扩散模型来预测化学反应中最关键的过渡态结构,不仅计算速度提升1000倍,结果也竟然意想...
-
stable-diffusion-webui sdxl模型代码分析
采样器这块基本都是用的k-diffusion,模型用的是stability的原生项目generative-models中的sgm,这点和fooocus不同,fooocus底层依赖comfyui中的models,comfy是用load_state_dict的...
-
深度学习中实现PyTorch和NumPy之间的数据转换知多少?
在深度学习中,PyTorch和NumPy是两个常用的工具,用于处理和转换数据。PyTorch是一个基于Python的科学计算库,用于构建神经网络和深度学习模型。NumPy是一个用于科学计算的Python库,提供了一个强大的多维数组对象和用于处理这些数组...
-
GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大
多模态大语言模型展现了强大的图像理解和推理能力。 但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。 即便是当前最强大的GPT-4V(如下图所示),也无法很好地解决这一问题。 △ GPT-4V的错误案例 现在,华科大和上科大团队提出了一个赋予...