-
Pika官网体验入口 AI视频生成制作平台在线使用地址
Pika是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。主要功能有:支持多种创意想法转视频,视频效果专业,操作简单易用。平台采用免费试用模式,定位面向创意者和视频爱好者。 点击前往Pika官网体验入口 Pika适用于需要快速...
-
2024年1月17日Arxiv最热论文推荐:清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作
本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台(saibomaliang.com)上的智能体 「AI论文解读达人」 提供。 如需查看其他热门论文,欢迎移步 ...
-
Llama-2+Mistral+MPT=? 融合多个异构大模型显奇效
随着 LLaMA、Mistral 等大语言模型的成功,各家大厂和初创公司都纷纷创建自己的大语言模型。但从头训练新的大语言模型所需要的成本十分高昂,且新旧模型之间可能存在能力的冗余。 近日,中山大学和腾讯 AI Lab 的研究人员提出了 FuseLLM,用...
-
抖音官方下场做AI直播切片 第三方团队或加速淘汰!
“小杨哥直播全程高能,哈登为带货速度惊掉下巴……” “网友问毛毛姐和刘思瑶的关系,阿姨的回答让人大跌眼镜” “罗永浩向董宇辉发出邀请,只要加盟价格不是问题” 在抖音中很多网友应该都刷到过类似内容切片,这些短视频通常会把头部主播直播的精彩片段浓缩在30秒内,...
-
AI工具网站使用合集大清单!写论文、写文案、AI绘画、画流程图、AI英语助教等
目录 一、GPT-4可用平台一览 1. Forefront 2. Ora 3. TDChat 4. Fastgpt 5. Cursor 6. POE 7. NewBing 二、GPT-3.5平台 1. aichat 2. BaiCha...
-
重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型
无需任何训练数据,只需对着模型描述一句话,如「一个做作业的香蕉人」: 或是「一只戴着 VR 眼镜的猫」: 就能生成符合描述的带有高质量纹理贴图的 3D 场景。不仅如此,还能对已有的 3D 模型进行精细化贴图。 这是港大与清华大学联合 3D 生成明星...
-
Taylor Swift不雅照被疯传!AI背后的隐患和危机引人深思...
如今本就是一个信息爆炸的年代,再伴随2023年AI技术的井喷式发展,AI正在以迅雷不及掩耳之势渗透到我们生活的方方面面。不过,AI技术是一把双刃剑,我们在享受AI技术带来的便捷和实用的同时,也不得不去面对它对于我们隐私可能造成的侵犯。 在这个问题上首当其冲...
-
利用人工智能减少碳排放的策略
随着世界努力应对气候变化的迫切需要,人工智能(AI 等创新技术成为追求可持续发展的有力工具。本文探讨了利用人工智能减少各个行业碳排放的策略,强调了人工智能在应对气候变化方面推动变革的潜力。 能源效益优化 人工智能驱动的算法可以优化各个行业的能源消耗,识...
-
豆包体验入口 智能AI聊天机器人在线使用地址
豆包是一款智能聊天机器人,能够与用户进行自然语言交互,提供各种聊天话题,包括天气、新闻、笑话、音乐等。豆包还能够根据用户的喜好和习惯,推荐相关的内容和服务。豆包是你的私人聊天助手,让你不再孤单。 点击前往豆包体验入口 豆包适用于任何需要聊天的场景,可以陪...
-
Windows端部署Stable Diffusion完整教程
1 环境准备 1.1 python安装 Python 3.10.6 Python3.10的安装方法(Windows10版本)_python3.10.10_ckirt的博客-CSDN博客 1.2 cuda安装 详细参见: Windows环境关于C...
-
年轻人的第一个多模态大模型:1080Ti轻松运行,已开源在线可玩
一款名为Vary-toy的“年轻人的第一个多模态大模型”来了! 模型大小不到2B,消费级显卡可训练,GTX1080ti 8G的老显卡轻松运行。 想将一份文档图片转换成Markdown格式?以往需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤...
-
微软开发新型大模型压缩方法SliceGPT
SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。 这意味着使用SLICE...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
微软CEO将于2月7日访问印度 将与多位AI创始人会面
微软公司首席执行官萨蒂亚·纳德拉将于 2 月 7 日和 8 日访问印度,这是他每年对该国的例行访问, 2024 年的主要主题是人工智能(AI)及其机遇。 几周前,微软印度和南亚地区总裁普内特·钱多克在一封内部邮件中表示,纳德拉的访问强化了微软利用技术扩大...
-
ChatGPT和文心一言哪个好用?
#ChatGPT 和文心一言哪个更好用?# 在当今信息爆炸的时代,人们对于文本生成和创作工具的需求越来越高。在这个背景下,ChatGPT和文心一言作为备受瞩目的工具,各自拥有独特的功能和用途。在本文中,我们将深入探讨这两个工具的优势和适用场景,以帮助读者...
-
更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。 在这一背景下,M-A-P 开源社区、港科大、滑铁卢大学、零一万物等联合推出了面向中文大规模多...
-
抖音即创体验入口 AI生成视频图文在线使用地址
抖音即创工作台是一款一站式的智能创意生产与管理平台。作为一个全流程服务的创意助手,它集成了视频创作、图文创作、直播创作等多种创意工具,通过AI的力量大大提高了创作效率。无论是视频、图文还是直播内容,抖音即创都能助你轻松应对。主要功能和优势包括: 视频...
-
Unity3d引擎中使用AIGC生成的360全景图(天空盒)
前言 在这里与Skybox AI一起,一键打造体验无限的360°世界,这是这个AIGC一键生成全景图的网站欢迎语。 刚使用它是23年中旬,在没有空去给客户实地拍摄全景图时,可以快速用它生成一些相关的全景图,用作前期沟通的VR demo。当时使用所有都...
-
OT系统如何应对生成式AI带来的安全挑战?
如今,大多数网络攻击主要使用两种方法:数据泄露和数据加密。这些策略被证明是有效的,因为攻击者可以通过威胁发布泄露的数据或要求支付解密费用来勒索钱财。这些攻击虽有恶意,但程度有限。他们的目标通常不是给人们造成重大伤害,但也有攻击者走得更远的情况。 在现代...
-
AI生成动画图像视频在线使用地址 Animate Anyone体验入口
Animate Anyone旨在通过驱动信号从静态图像生成角色视频,是一款专为角色动画量身定制的新框架。利用扩散模型的力量,该工具在角色动画方面表现出色。为了保持参考图像中复杂外观特征的一致性,设计了ReferenceNet来通过空间注意力合并详细特征。为...
-
【AIGC】从零手写一个GPT
手写一个GPT 在GPT,确切的说是Transformer,出现之前,一个问题长久地困扰着人们——如何让两句内容不同、但语义相近的句子得到较为接近的表示。 比如我们有两句话 我喜欢你 吾中意你 它们作为句子内容并不一样,但是表达的含义却...
-
GenAI成功道路上的十个“坑”
想要实现生成式人工智能(GenAI)?是个好消息!大多数IT决策者都看到了这种变革性技术的潜力,您可以将自己视为其中之一。虽然GenAI有可能为业务增加显著的效率,但它也带来了一系列必须克服的挑战。 以下是实施GenAI的十大挑战,按重要性降序排列。...
-
谷歌与Singular Computing达成AI专利纠纷和解
谷歌刚刚和一家人工智能技术专利诉讼的对手达成了数十亿美元的和解。这家硬件和软件开发公司Singular Computing从谷歌那里获得了一笔未公开的和解金,这结束了Singular的创始人Joseph Bates博士对谷歌提起的长达五年的联邦法院专利侵权...
-
Windows11 Copilot助手开启教程(免费GPT-4)
Windows11上开启Copilot助手教程+踩坑指南 Copilot介绍 Copilot开启步骤 1、更新系统 2、更改语言和区域 3、下载 ViVeTool 工具 4、开启Copilot 使用 Copilot介绍 Win...
-
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
AI正在使全球的代码质量下降! 最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。 这引起了全网热烈讨论: 「借助AI提供商,您可以将代码生成速度提高50%(即使是您不理解或无法编写的代码),但代价是代码的质...
-
谷歌与Hugging Face携手,共推开源模型助力AI发展
Google与Hugging Face近日宣布战略合作,旨在推动开放AI和机器学习的发展。这一合作将集成Hugging Face的平台与Google Cloud的基础设施,包括Vertex AI,旨在使生成式AI更易于开发者使用。这一合作的重要性被认为是A...
-
Stable Diffusion XL总结
Stable Diffusion XL是一个二阶段的级联扩散模型,包括Base模型和Refiner模型。其中Base模型的主要工作和Stable Diffusion一致,具备文生图,图生图,图像inpainting等能力。在Base模型之后,级联了Refi...
-
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板
当你让大模型写一首「莎士比亚十四行诗」,并以严格的韵律「ABAB CDCD EFEF GG」执行。 同时,诗中还要包含提供的3个词。 对于这么高难度的创作题,LLM在收到指令后,并不一定能够按要求做出这首诗。 正所谓,人各有所长,LLM也是如此,仅凭单...
-
腾讯文档智能助手体验入口 AI文档写作、数据分析、PPT制作在线使用地址
腾讯文档智能助手是一款强大的AI文档工具,可广泛应用于文档写作、数据分析、演示文稿制作等场景,辅助实现高效办公和创作。该智能助手正式开启公测,与Word、Excel、PPT等多品类文档进行智能互动,支持内容秒级生成,实现数据处理、版式美化等创作辅助功能。主...
-
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
文本嵌入(word embedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等, 比如在IR领域,第...
-
《幻兽帕鲁》使用了哪些人工智能技术?palworld如何应用AI技术
《幻兽帕鲁》是一款开放世界生存游戏,玩家可以收集和利用各种神奇的生物“帕鲁”。这款游戏引起了很多关注,也引发了一些争议,有人质疑它是否使用了生成式AI技术来设计游戏内容。 点击前往AI:Art Impostor体验入口 与《幻兽帕鲁》有关的AI产品或服务...
-
十分钟读懂Stable Diffusion运行原理
AIGC 热潮正猛烈地席卷开来,可以说 Stable Diffusion 开源发布把 AI 图像生成提高了全新高度,特别是 ControlNet 和 T2I-Adapter 控制模块的提出进一步提高生成可控性,也在逐渐改变一部分行业的生产模式。惊...
-
AI也造代码屎山!研究发现GitHub Copilot代码可维护性差,偏爱“无脑重写”而非重构复用已有代码
AI帮忙写代码程序员用了都说好,但代码质量真的靠谱吗? 结果或许令你大跌眼镜。 一家名为GitClear的公司分析了近四年超过1.5亿行代码后发现,随着GitHub Copilot工具的加入,代码流失率(即代码写入后不久又被返工修改、删除的情况)出现了显...
-
百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和...
-
30 年首次改版,微软为 AI 对 PC 下手,在键盘上新增 Copilot 键
一键启动 Copilot 生成式 AI 助手 “全面拿下 AI”,如今的微软正在冲破软件的束缚,开始向硬件设备发起挑战。 1 月 4 日,微软带来最新消息:希望 2024 年能成为“AI PC 年”,于是,其为 Windows 11 电脑推出一个全新的...
-
从零手搓MoE大模型,大神级教程来了
传说中GPT-4的“致胜法宝”——MoE(混合专家)架构,自己也能手搓了! Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。 这个项目被作者叫做MakeMoE,详细讲述了从注意力构建到形成完整MoE模型的过程。...
-
Unbound官网体验入口 AI产品照片生成工具在线使用地址
Unbound– AI 产品照片 是一款利用人工智能生成逼真产品照片的工具。无论您是自动化在线业务、社交媒体、广告宣传还是其他场景的用户,Unbound都能满足您的需求。它可以在几秒钟内生成任何尺寸的产品照片,根据用户提供的透明图片生成无限多的专业产品照片...
-
比亚迪发布璇玑AI大模型;微软推出Copilot Pro;国内首个MoE模型上线
比亚迪发布璇玑 AI 大模型 1 月 16 日,在 2024 比亚迪梦想日活动上,比亚迪正式发布了整车智能化架构「璇玑」及「璇玑 AI 大模型」。 比亚迪产品规划及汽车新技术研究院院长杨冬生称,「璇玑」是行业首个智电融合的智能化架构,让汽车拥有...
-
AI时代来了,专业摄影师会被淘汰吗?
现在科技界几乎已经形成一种共识,即随着AI的进化,很多职位将会被替代,当中就包括专业摄影师。 Medium在报告中指出:“随着AI和图像处理技术的发展,摄影正在从高技巧创作变成了以技术驱动的创作。在技术的加持下,即使是普通用户,也可以拍出高质量影像,传...
-
LangGraph:构建智能对话的AI库,轻松打造复杂、有记忆的应用
在构建能够对用户输入做出响应、记住过去互动并基于历史做出决策的系统时,LangGraph库成为解决这一问题的关键工具。这一需求对于创建更像智能代理的应用至关重要,这些应用能够保持对话、记住先前的上下文,并做出明智的决策。 当前存在一些解决方案,它们可以部分...
-
学习之旅:揭秘AI绘画与视频生成的奥妙(2)
前言 在这篇文章中,我们将深入探讨如何使用Ebsynth Utility插件为视频带来全新的视觉效果。通过重绘视频,我们可以实现对视频风格的调整,为其增添独特的艺术氛围。我们将分享实际操作步骤以及过程中可能遇到的问题,帮助大家更好地掌握这...
-
360度无死角!UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
输入一张任意姿势的照片,想让照片里的人跟随「指定视频」来进行动作模仿并不简单,除了肢体动作的模仿外,模型还需要对运动过程中衣服、人物外观的变化进行建模。 如果输入图像是正面的,而模仿的视频动作包括转身的话,模型还需要「想象」出衣服的背面样子,以及衣...
-
谷歌AI研究提出 SpatialVLM:一种数据合成和预训练机制,以增强视觉语言模型 VLM 空间推理能力
谷歌AI研究团队最近提出了SpatialVLM,这是一种旨在增强视觉语言模型(VLMs)空间推理能力的创新系统。 尽管先进的模型如GPT-4V在人工智能驱动任务中取得了显著进展,但它们在空间推理方面仍存在显著局限。空间推理涉及理解物体在三维空间中的位置以及...
-
AWS Iot Device Shadows
参考连接:AWS IoT Device Shadow 服务 - AWS IoT Core (amazon.com 1、 Device shadow基本概念 设备的影子是用于存储和检索设备的当前状态信息的 JSON 文档。(存储在AWS IOT c...
-
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了
来了,贾扬清承诺的 Lepton Search 开源代码来了。 前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。 项目链接:https://github.com/le...
-
三星与百度合作,为Galaxy S24系列创造AI体验
三星在中国选择了一个合法的替代方案,即与百度AI Cloud展开合作。这一战略伙伴关系的宣布意味着三星电子中国和百度将共同创造一种AI体验,以提升三星Galaxy S24系列的功能。 在这次合作中,百度的文心一言基础模型将与Galaxy AI深度集成,为...
-
ChatGPT与文心一言:谁更胜一筹?
在人工智能领域,语言模型的发展日新月异,ChatGPT与文心一言作为市面上两款备受瞩目的AI助手,各自具有一定的优势。本文将从智能回复、语言准确性和知识库丰富度等方面,对这两大AI助手进行比较,以期为大家提供一些参考。 一、智能回复 在智能回复方面,C...
-
Meta官方的Prompt工程指南:Llama 2这样用更高效
Meta官方的Prompt工程指南:Llama 2这样用更高效...
-
通义千问视觉语言模型Qwen-VL在线体验入口 阿里云AI在线使用入口
Qwen-VL是阿里云推出的通用型视觉语言模型,具备强大的视觉理解和多模态推理能力。采用 Transformer 结构,以 7B 参数规模进行预训练,支持 448x448 分辨率,能够端到端处理图像与文本的多模态输入与输出。Qwen-VL在多个视觉基准测试...
-
人工智能和机器学习在物联网中的作用有哪些
将人工智能(AI 和机器学习(ML 集成到物联网(IoT 系统中,标志着智能技术发展的革命性一步。这种融合通常被称为AIoT(物联网人工智能 ,不仅是能力的增强,而且是物联网系统如何运行、学习和适应环境的根本转变。让我们来探讨一下这种集成及其含义。 人...