负载均衡第2页 - AIGC资讯

[AIGC] Tomcat：一个简单 and 高效的 Java Web 服务器

Tomcat（Tomcat Server）是 Apache 基金会下的一个开源项目，它是一个简单 and 高效的 Java Web 服务器，支持 Servlet 2.5、JSP 2.2 和 EL 2.2 规范。Tomcat 是当今最受欢迎的 Java We...

生成式AI 2024-02-28 人工智能

882阅读

[AIGC] 消息积压了，该如何处理？

在构建分布式系统时，开发人员经常会遇到消息积压的问题。当系统的处理能力不足时，消息会在队列中积压，导致系统 slowed down 或 even crashed。为了解决这个问题，我们需要采取一些措施来缓解消息积压。文章目录什么...

AIGC 2024-02-24 人工智能

827阅读

vivo 基于 StarRocks 构建实时大数据分析平台，为业务搭建数据桥梁

在大数据时代，数据分析和处理能力对于企业的决策和发展至关重要。 vivo 作为一家全球移动互联网智能终端公司，需要基于移动终端的制造、物流、销售等各个方面的数据进行分析以满足业务决策。而随着公司数字化服务的演进，业务诉求和技术架构有了新的调整，已有的...

人工智能 2024-02-21 人工智能

990阅读

[AIGC 大数据基础] 大数据流处理 Kafka

在当今信息时代，我们生活在一个数据爆炸的世界中。大数据处理已成为各行各业中不可或缺的一部分。在大数据处理的过程中，流处理变得越来越重要，因为我们需要实时地处理和分析数据，以便做出及时的决策。在这篇博客中，我们将介绍一种流行的大数据流处理工具——Kafka，...

AIGC 2024-02-16 人工智能

931阅读

打破MoE训练效率与性能瓶颈，华为盘古稀疏大模型全新架构LocMoE出炉

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数...

生成式AI 2024-02-04 人工智能

909阅读

人工智能可以帮助改善云计算管理有哪些方式

当企业考虑云管理时，主要考虑的是运营流程，例如监控性能、维护安全性和确保合规性。这些都是成功开展业务的重要方面，但这只是云管理所需要的一部分。一个经常被忽视的关键方面是通过提供直观的工具和集成的支持流程来改善用户体验，从而消除企业IT基础设施的一些麻...

生成式AI 2024-02-04 人工智能

901阅读

基于文心一言千帆API和gradio实现大模型多伦对话web应用

随着人工智能技术的不断发展，大模型多轮对话系统在web应用中越来越受到关注。文心一言千帆API和gradio工具为此提供了强大的支持。本文将介绍如何利用这两个工具，快速实现大模型多轮对话的web应用。一、文心一言千帆API介绍文心一言千帆API是一个...

人工智能 2024-01-27 人工智能

1211阅读

再薅！Pika全球开放使用；字节版GPTs免费不限量；大模型应用知识地图；MoE深度好文；2024年AIGC发展轨迹；李飞飞最新自传 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 终于！AI视频生成平台 Pika 面向所有用户开放网页端 https://twitter.com/pika_labs Pika...

大数据 2024-01-13 人工智能

1029阅读

AI平台：阿里云-计算，为了无法计算的价值

阿里云-计算，为了无法计算的价值阿里云-为了无法计算的价值产品热门产品计算容器存储网络与CDN安全中间件数据库大数据计算人工智能与机器学习媒体服务企业服务与云通信物联网Serverless开...

人工智能 2024-01-06 人工智能

891阅读

AI平台：alibabawood

alibabawood 登录多元电商视频智能创作拍摄视频自动剪辑线上商品做视频视频混合商品图自动剪辑一键衍生快速投放多画幅版本多时长版本支持一键投放线上有效快速提升商品和店铺收益商品成交平均提升+17%商品曝光平均提升+13%店铺访客数+1...

AIGC 2024-01-06 人工智能

1070阅读

使用 OpenLLM 构建和部署大模型应用

本次分享主题为：使用 OpenLLM 快速构建和部署大语言模型的应用。OpenLLM 是一个开源的大语言模型（LLM）开发框架。它支持多种开源的 LLM 模型，并且具有内建的两个关键的 LLM 优化，能够优化内存使用。此外，它与 LangChain 和...

生成式AI 2024-01-05 人工智能

1324阅读

同花顺推出问财大模型HithinkGPT 开启内测申请

同花顺问财推出了 HithinkGPT 大模型，采用 transformer 的 decoder-only 架构。提供7B、13B、30B、70B 和130B 五种版本选择，最大允许32k 文本输入，支持 API 接口调用、网页嵌入、共建、私有化部署等能力...

AIGC 2024-01-03 人工智能

882阅读

用于备份和灾难恢复的生成式 AI 工具仍处于早期阶段

备份软件供应商已经推出了用于自动化和虚拟助手的生成式 AI 工具，但这些新增功能如何增强企业工作流程还有待观察。数据备份和灾难恢复供应商希望他们的生成式 AI 助手成为您企业最好的朋友，但即使经过近一年的炒作和销售，其好处也不明显。这些用于备份和灾...

大数据 2023-12-20 人工智能

965阅读

客户案例：高性能、大规模、高可靠的AIGC承载网络

客户是一家AIGC领域的公司，他们通过构建一套完整的内容生产系统，革新内容创作过程，让用户以更低成本完成内容创作。客户网络需求汇总 RoCE的计算网络 RoCE存储网络 1.不少于600端口200G以太网接入端口，未来可扩容至至少128...

人工智能 2023-12-04 人工智能

963阅读

RabbitMQ消息顺序性解密：保证消息的正确顺序

在分布式系统中，保证消息的正确顺序对于一些应用场景至关重要。而RabbitMQ作为一种流行的消息队列系统，本身并不提供严格的消息顺序保证。下面将探讨如何在使用RabbitMQ时实现消息的正确顺序，并介绍一些常见的解决方案和注意事项。一、引言 Rabbi...

人工智能 2023-12-04 人工智能

848阅读

构建大规模数据存储解决方案：探索MongoDB的横向扩展

MongoDB是一个非常适合构建大规模数据存储解决方案的NoSQL数据库。它通过横向扩展的方式来应对不断增长的数据量和负载需求。下面将详细介绍MongoDB的横向扩展机制，并探索如何使用MongoDB来构建高性能、可伸缩的大规模数据存储解决方案。横向扩...

生成式AI 2023-12-01 人工智能

844阅读

腾讯披露最新大模型训练方法:Angel框架升级效率提升2.6倍

在当前大模型参数规模呈指数级增长的情况下，腾讯近日披露了混元大模型训练的最新方法，通过升级自研机器学习框架Angel，成功提升大模型训练效率。这一升级使得千亿级大模型训练可以节省高达50%的算力成本，为应对算力紧缺提供了有力支持。Angel框架的升级不仅仅...

生成式AI 2023-11-27 人工智能

874阅读

首个ChatGPT开发的应用上线；ChatMind思维导图工具；中文提示词大全；Copilot平替 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 『一本与众不同的AI绘本』ChatGPT 编写故事 + Midjourney 绘制插图作者的女儿特别喜欢迪士尼动画《海洋奇缘》里的主人公莫阿娜，...

大数据 2023-11-25 人工智能

965阅读

Stable Diffusion云端部署流程与注意点

前言在今天的大数据时代，AI绘图是企业必备的重要工具之一。而Stable Diffusion作为一款部署的AI绘图，得到了很多企业和团队的认可。在使用Stable Diffusion的过程中，云部署是一个非常重要的话题，本文将详细介绍Stable Di...

人工智能 2023-11-13 人工智能

916阅读

百度搜索深度学习模型业务及优化实践

作者 | Xin 导读百度搜索架构部模型架构组，致力于将最新的人工智能技术以更低的成本被百度数亿用户体验到。这个过程中会面临非常多的系统、工程层面的问题，甚至在深度学习模型领域，我们看到越来越多的工作并不拘泥于工程本身。本文主要分享模...

AIGC 2023-11-10 人工智能

886阅读

基于容器平台 ACK 快速搭建 Stable Diffusion

作者：子白本文介绍如何在阿里云容器平台 ACK 上快速搭建一套可对外提供服务的 Stable Diffusion。 CPU 版本前提条件已创建 Kubernetes 托管版集群。具体操作，请参见创建 Kubernetes 托管版集群[1]...

大数据 2023-11-10 人工智能

834阅读

python爬虫入门教程(非常详细)

1、什么是爬虫爬虫指的是一种自动化程序，能够模拟人类在互联网上的浏览行为，自动从互联网上抓取、预处理并保存所需要的信息。爬虫运行的过程一般是先制定规则（如指定要抓取的网址、要抓取的信息的类型等），紧接着获取该网址的HTML源代码，根据规则对源代码进...

大数据 2023-11-09 大数据

915阅读

MoE：LLM终身学习的可能性

性质说明知识记忆（knowledge retention） √ LLM预训练后，具备世界知识，小规模finetune不易对LLM造成遗忘灾难。但大规模数据续训会造成。前向迁移（forward...

大数据 2023-11-08 人工智能

958阅读

可观测数据采集端的管控方案的简单对比

概述当前，主流的日志采集产品除了SLS的ilogtail，还有Elastic Agent、Fluentd、Telegraf、Sysdig、Logkit、Loggie、Flume等。详细的对比结果见下表：备注：集群监控：表示工具可以查看管理采集...

生成式AI 2023-11-08 大数据

1057阅读

国内最具影响力科技创投媒体36Kr的容器化之路

本文由1月19日晚36Kr运维开发工程师田翰明在Rancher技术交流群的技术分享整理而成。微信搜索rancher2，添加Rancher小助手为好友，加入技术群，实时参加下一次分享~ 田翰明，36Kr 运维开发工程师，在 36Kr 主要负责运维...

AIGC 2023-11-08 大数据

927阅读

Koordinator v1.1发布：负载感知与干扰检测采集

作者：Koordinator 社区背景 Koordinator 旨在为用户提供完整的混部工作负载编排、混部资源调度、混部资源隔离及性能调优解决方案，帮助用户提高延迟敏感服务的运行性能，挖掘空闲节点资源并分配给真正有需要的计算任务，从而提高全局的资源利...

人工智能 2023-11-08 大数据

881阅读

直击 | 认识和了解bboss

1. BBoss是什么 bboss是一个基于开源协议Apache License发布的开源项目，由开源团队bboss运维，主要由以下三部分构成： Elasticsearch Highlevel Java Restclient ，一个高性能高兼容性的...

人工智能 2023-11-08 大数据

1271阅读

云原生在京东丨云原生时代下的监控：如何基于云原生进行指标采集？

从 Kubernetes 成为容器管理领域的事实标准开始，基于云原生也就是基于 Kubernetes 原生。在云的体系下，基础硬件基本上都被抽象化、模糊化，硬故障需要人为干预的频次在逐渐降低，健康检查、失败自愈、负载均衡等功能的提供，也使得简单的、毁灭性的...

AIGC 2023-11-08 大数据

899阅读

爬虫实战1——获取某主页的所有跳转链接

文章目录为什么用python写任务需求以爬某不知名网站为例：准备工作开始写爬虫后续 ip池 end 为什么用python写开发效率高，代码简洁，一行代码就可完成请求，100行可以完成一个复杂的爬虫任务；爬虫对于代码...

大数据 2023-11-08 大数据

767阅读

技本功丨骚操作：教你如何用一支烟的时间来写个日志采集工具

作者：良辰袋鼠云日志团队后端开发工程师我放下了手中的键盘，陷入沉思，作为一个优秀的程序猿最重要的就是气~势~ 泰山崩于前的镇~定~ 我用最快的速度扫描了一遍现行的 filebeat、fluentd、flume、 sc...

大数据 2023-11-08 大数据

849阅读

20.网络爬虫—Scrapy-Redis分布式爬虫

网络爬虫—Scrapy-redis详讲 Redis的安装与使用分布式概念和作用分布式爬虫分布式爬虫特点 redis的使用 Redis 操作/启动 Redis Desktop Manager下载特点和架构安装和使用 Scrapy-re...

大数据 2023-11-08 大数据

854阅读

LC3视角：Kubernetes下日志采集、存储与处理技术实践

摘要：在Kubernetes服务化、日志处理实时化以及日志集中式存储趋势下，Kubernetes日志处理上也遇到的新挑战，包括：容器动态采集、大流量性能瓶颈、日志路由管理等问题。本文介绍了“Logtail + 日志服务 + 生态”架构，介绍了：Logta...

人工智能 2023-11-08 大数据

995阅读

数据采集框架 kafka

一、简介（1）定义：Kafka是一种高吞吐量的分布式发布订阅消息系统，被设计成能高效处理大量实时数据，其特点是快速的、可拓展的、分布式的、分区的和可复制的（2）消息系统作用：削峰：用于承接超出业务系统处理能力的请求，使业务平稳运行。这能够大...

人工智能 2023-11-08 大数据

809阅读

大数据采集方法

大数据采集是指从传感器和智能设备、企业在线系统、企业离线系统、社交网络和互联网平台等获取数据的过程。数据数据包括RFID数据、传感器数据、用户行为数据、社交网络交互数据及移动互联网数据等各种类型的结构化、半结构化及非结构化的海量数据。大数据的分...

人工智能 2023-11-08 大数据

959阅读

大数据采集有哪些方法？

随着信息时代的到来，大多数数据抓取工作主要是通过网络来采集，毕竟数据数据的产生和流动几乎在我们生活中每时每刻都在产生。除了网络数据的采集还有现在的数据调研和抽查的方式，这里我们主要讲讲网络数据的采集。针对4种不同的数据源，大数据采集方法有以下几大类。...

大数据 2023-11-08 大数据

930阅读

数据采集组件：Flume基础用法和Kafka集成

一、Flume简介 1、基础描述 Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；特点：分布式、高可用、基于流式架构，通常用来收集、聚合、...

生成式AI 2023-11-08 大数据

788阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1650阅读