-
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?
rg/abs/2404.03820 这篇论文提出了 CantTalkAboutThis 数据集,其设计目的是帮助 LLM 在面向任务的对话中不偏离话题(其中包括多种领域的合成对话,并具有分散话题的内...
-
AMD:四季度推出MI325X AI芯片 比英伟达H200快30%
计划在2025年推出新一代的MI350系列芯片。这款芯片将采用尖端的3nm制程技术,并基于全新的构架设计。 MI350系列将集成288GB的HBM3E内存,并支持FP4/FP6数据格式,使其在推理运算...
-
首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度
提出了一种创新方法,即整合时空编码器来提升大型语言模型捕捉时空上下文中时间依赖性的能力。具体来说,所设计的时空编码器由两个核心组件构成:一个是门控扩散卷积层,另一个是多层次关联注入层。 门控时间扩散...
-
活体脑细胞做成16核芯片,用Python就能编程,九个机构开展实验36所大学排队
rl Friston,该系统根据他颇受争议的自由能原理(Free Energy Principle)设计。 Friston曾与AI教父Hinton在英国伦敦大学学院与共事,两人是多年好友,他曾透露是...
-
昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
的 Aux Loss。此外,为了高效进行大规模分布式训练,Skywork-MoE 提出了两个并行优化设计:Expert Data Parallel 和非均匀切分流水并行。 在推理方面,Skywork-...
-
【AIGC】本地部署 ollama(gguf) 与项目整合
llama.cpp 创始人 Georgi Gerganov 提出并定义,是一种针对大规模机器学习模型设计的二进制格式文件规范,主要用于高效存储和交换大模型的预训练结果。GGUF 的主要优势在于,它能够...
-
原来这才是生成式AI!
成千上万个小处理单元并行工作,大幅提高了计算效率。 TPU(张量处理单元):专门为加速人工智能学习而设计的硬件,能够显著加快计算速度,进一步增强了骨架的强度。 存力——泥人的血液 生成式AI需要处理...
-
AI日报:SD 3宣布开源;中文语音AI天花板ChatTTS官网上线;Veo支持单图生成视频;ElevenLabs推多样化AI音频模型
物平台首次亮相,为数字人物提供支持。这些技术加速了500多个PC应用和游戏以及200多个OEM笔记本设计,为超过1亿的RTX AI PC用户带来下一代AI动力体验。 12、麦肯锡调查显示:生成式AI...
-
Defog发布Llama-3-SQLCoder-8B,文本转SQL模型,性能比肩GPT-4,准确率超90%,消费级硬件可运行
框架,能够识别包含多个正确答案的查询,这在实际应用中至关重要,因为它允许模型根据用户的需求和数据库的设计,灵活地生成不同的SQL查询。 轻量级设计,消费级硬件可运行 SQLCoder-8B模型拥...
-
利用人工智能和机器人推动科学发展
室将每个机器人仪器放在小推车上。每个小车包含所有需要的计算能力和传感器从而使仪器工作,并确保它的功能设计。这个系统的美妙之处在于每个仪器都是独立的,所以科学家们可以把小推车从其他仪器上卸下来,然后把另...