-
LLMs之RAG:只需四步骤—基于Ollama后端框架(配置phi3/LLaMA-3模型)结合Dify前端框架(设置知识库文件+向量化存储+应用发布)创建包括实现本地知识库问答/翻译助手等多个应用
LLMs之RAG:基于Ollama后端框架(配置phi3/LLaMA-3模型 结合Dify前端框架(设置知识库文件+向量化存储+应用发布 创建包括实现本地知识库问答/翻译助手等多个应用 目录 基于Ollama后端框架(配置phi3/LLaMA-...
-
x-cmd mod | x whisper - 使用 whisper.cpp 进行本地 AI 语音识别
介绍 Whisper 模块通过 whisper.cpp 帮助用户快速将音频转换为文字。 INFO: whisper.cpp 是一个用 C/C++ 编写的轻量级智能语音识别库,是基于 OpenAI 的 Whisper 模型的移植版本,旨在通过深度...
-
通用世界模型问世:不学习就能生成新领域视频,可实时控制
随着 OpenAI 今年 2 月发布 Sora,世界模型(World Model)再次成为了 AI 领域的热门。 世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,一直以来被认为是通往通用人工智能(AGI)的关键路径之一,与当前大模型推崇的智能...
-
ChatGPT改进的数据分析功能开始推送:速度与交互体验大提升
视频来自X博主@歸藏 近日,OpenAI 推出了最新的ChatGPT数据分析优化功能,给用户带来了极大的惊喜。新的优化不仅提升了处理速度,还加入了可交互的图表和表格,使得数据分析工具更加完备和强大。 具体优化如下: 速度提升:GPT-4o 的速度优势使...
-
一文带您了解SHAP:机器学习的模型解释
在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(Explainable AI ,XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任...
-
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
GPT-4可以通过图灵测试吗? 当一个足以强大的模型诞生之后,人们往往会用图灵测试去衡量这一LLM的智能程度。 最近,来自UCSD的认知科学系研究人员发现: 在图灵测试中,人们根本无法区分GPT-4与人类! 论文地址:https://arxiv.org...
-
ChatGPT现在允许用户直接从 Google Drive、Microsoft OneDrive 导入文件
OpenAI 本周宣布,其标志性大型语言模型(LL)ChatGPT 已更新,用户现可直接从外部云盘 Google Drive 和 Microsoft OneDrive 导入文件。该功能适用于 ChatG Plus、Team 和 Enterprise 用户,...
-
最详细人脑3D地图登Science!GPT-4参数只相当于人类0.2%
芝麻粒大小的人脑组织,突触规模就相当于一个GPT-4! 谷歌与哈佛联手,对局部人脑进行了纳米级建模,论文已登Science。 这是迄今为止最大、最详细的人脑复制品,首次展示出了大脑中的突触连接网络。 凭借超高分辨率,这个名为H01的重建,已经揭示了一些...
-
剪映上线即梦AI:输入简单指令生成视频
快科技5月9日消息,剪映Dreamina官宣其品牌正式更名为中文即梦”,同时宣布其AI作图和AI视频生成功能已全量上线。 即梦”作为一个全新的品牌,其核心功能包括图片生成、智能画布和视频生成,旨在为用户提供更为便捷、智能的创作体验。 在图片生成方面,即梦”...
-
即梦Dreamina:AI创作与智能设计的完美结合 - 使用教程与免费体验入口
即梦Dreamina 是什么? 即梦Dreamina是一款革命性的在线创作平台,它将人工智能技术与创意设计无缝结合,为用户提供了一个全新的视觉作品创作空间。通过即梦Dreamina,用户可以轻松地将他们的创意转化为引人入胜的图片、视频和故事内容。这款产品...
-
Dreamina正式更名为“即梦” AI绘画和AI视频功能全量上线
今天,剪映Dreamina官方宣布其品牌正式更名为中文「即梦」,同时宣布其AI作图和AI视频生成功能已全量上线。用户现在可以通过电脑浏览器访问新域名来体验这些功能。 即梦入口:https://top.aibase.com/tool/jimengdream...
-
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎
Sora刚发布后没多久,火眼金睛的网友们就发现了不少bug,比如模型对物理世界知之甚少,小狗在走路的时候,两条前腿就出现了交错问题,让人非常出戏。 对于生成视频的真实感来说,物体的交互非常重要,但目前来说,合成真实3D物体在交互中的动态行为仍然非常困难。...
-
实战干货|Spark 在袋鼠云数栈的深度探索与实践
Spark 是一个快速、通用、可扩展的大数据计算引擎,具有高性能、易用、容错、可以与 Hadoop 生态无缝集成、社区活跃度高等优点。在实际使用中,具有广泛的应用场景: · 数据清洗和预处理:在大数据分析场景下,数据通常需要进行清洗和预处理操作以确保数据...
-
基于图技术提升多模型协作性能
译者 | 朱先忠 审校 | 重楼 当今时代,各种人工智能模型的能力整合到一起已经释放出一股巨大的潜力。这种力量已经涉及到从需要视觉、语音、写作和合成等多种能力的复杂任务自动化到增强决策过程等诸多领域。然而,如何高效协调这些合作?无论在管理内部关系还是在管...
-
AI攻克费马大定理?数学家放弃5年职业生涯,将100页证明变代码
费马大定理,即将被AI攻克? 而且整件事最意味深长的地方在于,AI即将解决的费马大定理,正是为了证明AI无用。 曾经,数学属于纯粹的人类智力王国;如今,这片疆土正被先进的算法所破译,所践踏。 图片 费马大定理,是一个「臭名昭著」的谜题,在几个世纪以来,一...
-
【阿里云PAI】基于阿里云使用Stable Diffusion XL Turbo模型和DiffSynth UI实现AI作画
文章目录 @[toc] 教程简述 答疑交流群 使用PAI-DSW快速启动SD WebUI 1. 准备环境和资源 1.1. 领取交互式建模PAI-DSW免费试用权益 1.2. 创建PAI-DSW实例 1.3. 在DSW中打开教程文...
-
《AI星河》VR技术助力孤独症干预与康复 招募孤独症机构限时体验!
医学中,孤独症被定义为一种始于儿童早期,以社交与交流障碍、刻板行为和狭隘兴趣为核心症状的神经发育障碍性疾病。 据统计,我国孤独症儿童的患病率约为1%,这意味着每100个孩子中可能就有1个患有孤独症,且男童患病比例远高于女童,约为4:1。其中14岁以下的儿童...
-
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各...
-
陶哲轩转发、菲尔兹奖得主领衔:AI正在颠覆数学家的工作方式
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 陶哲轩点赞转发,《美国数学学会通报》用一整期特刊介绍了AI给数学带来的改变。 这些文章读起来很有趣,尽管使我自己即将发表的一篇文章显得多...
-
AIGC之gradio系列学习教程(二)Components
简述: 让我们继续了解一下 Gradio 的一些主要功能。本指南旨在对构建演示时应注意的各种事项进行高级概述。 Components Gradio 包含 30 多个预构建组件(以及许多用户构建的自定义组件),只需一行代码即可在演示中用...
-
AI公司出门问问通过港交所聆讯 有望成为AIGC第一股
据IPO早知道报道,“出门问问”日前成功通过港交所聆讯,并于4月2日公布了相关资料,旨在主板挂牌上市。本次上市由中金公司和招银国际共同担任联席保荐人,此举标志着出门问问或将引领AIGC行业,成为该领域的“第一股”。 据悉,出门问问是一家人工智能公司,专注于...
-
「有效上下文」提升20倍!DeepMind发布ReadAgent框架
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于Transformer的大语言模型(LLM)具有很强的语言理解能力,但LLM一次能够读取的文本量仍然受到极大限制。 除了上下文窗口...
-
萤石举办2024年春季新品发布会,多款智能家居AI新品强势来袭
3月31日,以“AI无界 萤未来”为主题的2024萤石春季新品发布会盛大开幕,千余名萤石合作伙伴齐聚杭州,共商渠道发展新策略,共享市场新机遇,共绘未来发展新蓝图,同时萤石携多项重磅新品亮相,向行业内外展示其在智能家居领域的最 新科技成果。 多项新技术的突...
-
使用Python访问和操作Llama的方法
使用Python访问和操作Llama的方法 Llama是一个流行的Python库,用于处理和操作数据集。它提供了丰富的功能和工具,使我们能够轻松地对数据进行处理、转换和分析。本文将介绍如何使用Python来访问和使用Llama库,并提供相应的示例代码。...
-
Miraa官网体验入口 AI双语字幕及日语英文语言辅助学习APP免费下载地址
Miraa是一款AI双语字幕及辅助学习APP。它能自动将视频/音频等媒体资料转录成字幕,并提供交互式AI解释和即时翻译功能,帮助用户高效学习。它的主要优势是无缝跟踪字幕并按用户节奏重复播放、AI交互解惑、实时翻译等。Miraa免费使用,但也提供增值付费服务...
-
DataCamp官网体验入口 数据科学AI在线免费课程资源学习地址
DataCamp是一个在线学习平台,专注于提供数据科学、AI 及相关领域的课程。它为用户提供了动手实践的学习体验,包含交互式练习和短视频,涵盖了多种话题,如 Python、R、SQL、ChatGPT 和 Power BI。DataCamp 还为学习者提供了...
-
一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前...
-
优于所有方法!HIMap:端到端矢量化HD地图构建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 矢量化高清(HD)地图构建需要预测地图元素的类别和点坐标(例如道路边界、车道分隔带、人行横道等)。现有技术的方法主要基于点级表示学习,用于回归精确的点坐标。然而,这种pipeline在获得elemen...
-
色彩的魅力与重构——从色彩采集到作业图片的再创作
色彩,作为视觉艺术中最为直观和感性的元素,承载着丰富的情感与象征意义。在设计领域中,对色彩的采集、分析和重构是一项既富有挑战性又充满创意的任务。本文将以“色彩采集重构作业图片”为主题,探讨色彩在设计中的重要作用,以及如何通过色彩的重构来赋予作品新的生命和内...
-
AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片
近期,一篇名为"StreamMultiDiffusion"的论文提出了一种新颖的实时、交互式的文本到图像生成系统。这种系统能够根据用户提供的手绘区域和相应的语义文本提示来生成图像,为专业图像创作者提供了一个强大的工具,可以用于快速原型设计和创意探索。 项...
-
深入探索“织梦采集侠”:源码解析与实践应用
随着信息技术的不断进步和网络的日益发达,网站内容的自动化采集技术应运而生,并且成为诸多网站运营者和开发者密切关注的领域。“织梦采集侠”作为一款备受关注的内容采集工具,凭借其高效灵活的特点在实际应用中被广泛采纳。本文将针对“织梦采集侠”的源码进行详尽解析,从...
-
帝国小说系统采集插件的双重影响
随着互联网技术的日益发达和网络小说的广泛流传,“帝国小说系统采集插件”作为一款知名的内容采集工具,早已在众多小说阅读平台、文学网站及个人博主之间名声在外。那么,究竟什么是帝国小说系统采集插件?它的存在给我们带来了什么样的影响和启示?以下就是针对该采集插件的...
-
Devin候补名单Waitlist申请入口 软件工程师编程AI助手详细使用方法教程指南
Devin是世界上第一款完全自主的AI软件工程师。具有长期推理和规划能力,可执行复杂工程任务,并与用户进行实时协作。帮助工程师专注于更有趣的问题,推动工程团队实现更宏伟的目标。 点击前往Devin候补名单Waitlist申请入口 谁可以从Devin中受益...
-
基于Discuz平台的资源采集技术与实践
Discuz作为一款广为使用的论坛系统软件,一直深受广大站长和社区运营者的青睐。在这个庞大的社区生态系统中,资源采集成了一项至关重要的技术。它不仅有助于站长高效地收集和整理信息,而且对于社区的持续活跃也起着举足轻重的作用。一、Discuz资源采集的定义及重...
-
新一代人工智能为智能数字进步的新时代铺平了道路
GenAI是人工智能(AI 领域的创新数字进步,将引领现代智能和理解时代。这项技术准备通过提高人工智能系统直观、智能地理解和响应人类输入的能力来改变我们与人工智能系统交互的方式。 预计到2030年,人工智能将为全球经济贡献15.7万亿美元,带动全球GDP...
-
AIGC 实战:如何使用 Ollama 开发自定义的大模型(LLM)
虽然 Ollama 提供了运行和交互式使用大型语言模型(LLM)的功能,但从头开始创建完全定制化的 LLM 需要 Ollama 之外的其他工具和专业知识。然而,Ollama 可以通过微调在定制过程中发挥作用。以下是细分说明: 预训练模型选择: Oll...
-
全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理解力接近人类
卷疯了卷疯了,大模型又变天了。 就在刚刚,全球最强AI模型一夜易主,GPT-4被拉下神坛。 Anthropic发布了最新的Claude 3系列模型,一句话评价:真·全面碾压GPT-4! 多模态和语言能力指标上,Claude 3都赢麻了。 用Anthrop...
-
自动化方程:在现代工作场所平衡人工智能、机器人和人类技能
人工智能(AI 技术融入工作场所正在迅速改变工作性质,并重新定义人与机器之间的关系。虽然人工智能无疑带来了颠覆,但它也通过创造、增强和转型为新机会铺平了道路。通过利用人工智能的能力,同时重视机器无法复制的人类技能,人类和机器人可以形成一种基于互补而非竞...
-
“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步
谷歌110亿参数Genie,用来打造交互虚拟世界,它来了! 划重点:不受视频监督训练;只用给它单张图像,就能提示生成可玩的2D虚拟世界;这个交互式的虚拟世界还自主可控。 但令人撇嘴的点,就是Genie最后出的效果,画质太糊了。 像这样: 或者这样:...
-
下一代移动计算的预测
随着技术以前所未有的速度发展,移动计算的未来有望实现变革性的进步。从增强的连接性到突破性的硬件创新,下一代移动计算将重新定义我们与数字世界互动的方式。本文将探讨预测移动计算发展轨迹的预测,并提供一些令人兴奋的可能性。 5G革命性的连接 无处不在的高速连...
-
LLaMA 2 - 你所需要的一切资源
摘录 关于 LLaMA 2 的全部资源,如何去测试、训练并部署它。 LLaMA 2 是一个由 Meta 开发的大型语言模型,是 LLaMA 1 的继任者。LLaMA 2 可通过 AWS、Hugging Face 等提供商获取,...
-
AIGC是什么?GPT-4.0、DALL·E以及Midjourney等多种智能服务
AIGC(人工智能生成内容,Artificial Intelligence Generated Content)是指利用人工智能技术自动生成的文本、图像、音频和视频等内容。随着技术的进步,AIGC已经成为创意产业和内容创作领域的一股新兴力量。MidTool...
-
如何探索和可视化用于图像中物体检测的 ML 数据
近年来,人们越来越认识到深入理解机器学习数据(ML-data)的必要性。不过,鉴于检测大型数据集往往需要耗费大量人力物力,它在计算机视觉(computer vision)领域的广泛应用,尚有待进一步开发。 通常,在物体检测(Object Detectio...
-
基于PAI-EAS一键部署Stable Diffusion AIGC绘画
人工智能平台PAI完成云上Stable Diffusion以文生图应用搭建,支持两种方式: 使用交互式建模 PAI-DSW 使用模型在线服务 PAI-EAS 两种部署适用人群: 1. 使用交互式建模 PAI-DSW 部署Stable Di...
-
GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动
一直以来,LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。 但是,它们该如何与世界进行最佳互动? 最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。 它通过采用可执行的Python代码,来...
-
SparkAi系统:全能AI工具箱,开源项目和AIGC系统的首选
Ai工具集导航(Ai-321.com) SparkAi系统官网:https://ai.sparkaigf.com/?inVitecode=KSJCIHPRHO Introduction: SparkAi系统是一款强大的AI工具箱,为用户提供了无...
-
吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。 前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,...
-
面向AI工程的五大JavaScript工具
令许多人惊讶的是,一向在Web开发领域中大放异彩的JavaScript在开发使用大语言模型(LLM 的应用程序方面同样大有价值。我们在本文中将介绍面向AI工程的五大工具,并为希望将LLM纳入其项目中的开发人员介绍一些必要的资源。 AI工程市场在2023...
-
新型IT运维管理,基础设施和数据两手都要硬
AI大模型时代,数据赋予IT人“新使命” 当下IT人在企业中扮演着运营支撑的角色。说到运维管理,相信每人都是一把辛酸泪,每天承担着繁琐、高负荷且又高风险的运维工作,但在业务规划和职业发展时又成为了“透明人”。业内有句调侃的话:“只花钱的人,不配拥有发...
-
比OpenAI官方提示词指南更全,这26条黄金准则让LLM性能飙升50%以上
论文地址: https://arxiv.org/abs/2312.16171 Github地址: https://github.com/VILA-Lab/ATLAS 论文标题:Principled Instructions Are All You...