客户端第7页 - AIGC资讯

kafka个人笔记

大部分内容源于https://segmentfault.com/a/1190000038173886, 本人手敲一边加强印象方便复习消息系统的作用解耦冗余扩展性灵活性（峰值处理可恢复顺序保证缓冲异步解耦：扩展两边处理过程，只需...

大数据 2023-11-16 人工智能

777阅读

微调Whisper语音识别模型和加速推理

前言 OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对W...

生成式AI 2023-11-16 人工智能

1255阅读

贝锐花生壳+Fooocus，快速自建可远程访问的SDXL，平替Midjourney

Midjourney、stable diffusion两款AI绘图工具是最近这段时间的热点。不过，事无完美，他们各有一些优缺点。例如：stable diffusion虽然开源可私有化部署，但操作相对复杂，需要设置各类参数；Midjourney虽然简...

大数据 2023-11-15 人工智能

853阅读

StableDiffusion-webUI环境配置、部署、汉化、扩展超详细步骤 || 服务器Linux Ubuntu/本地Windows || 比官方安装更高自定义度 || anaconda虚拟环境下

目录一、代码下载以下指令用git下载代码（可能不能直接跑通，后续需要修改一些代码，见“ 四、代码修改”部分） 1. 下载 stable-diffusion-webui 仓库 2. 下载其他仓库二、环境配置 0. 安装anaconda、...

生成式AI 2023-11-15 人工智能

1373阅读

人工智能领域如何保护数据机密性？

在不断变化的智能世界中，数据机密性和人工智能道德的融合已成为企业和社会的重大关注。这是一个需要探索的问题，技术进步应与道德原则保持一致。业界有责任应对这一挑战，并确保人工智能技术优先考虑并维护数据保密的重要性。道德义务数据隐私和数据的道德使用对于人...

人工智能 2023-11-14 人工智能

800阅读

如何申请文心一言&文心千帆大模型API调用资格、获取access_token，并使用SpringBoot接入文心一言API

前段时间，百度文心一言&文心千帆大模型开放了API调用的测试，接下来，教大家申请测试资格并接入文心千帆大模型的API。一、文心一言&文心千帆的测试资格申请 1. 确保拥有一个百度智能云的账号右上角点击注册，内容如实填写并完成实...

大数据 2023-11-13 人工智能

1249阅读

集成AIGC能力的多数据库客户端工具Chat2DB免费试用

一、简介 Chat2DB一款由阿里巴巴开源免费的多数据库客户端工具，支持windows、mac本地安装，也支持服务器端部署，web网页访问。和传统的数据库客户端软件Navicat、DBeaver 相比Chat2DB集成了AIGC的能力，能够将自然语言转换...

人工智能 2023-11-13 人工智能

1413阅读

Stable Diffusion使用civitai的模型进行AI绘图

准备工作 1.安装Stable Diffusion（B站秋叶大佬有完整包，开箱即用） 2.启动之后找到图中位置下载civitai助手下载完成之后，点击页面下方“重载客户端”。下载模型 1.进入C站，随便找一个点进去，复制浏览器的网址...

大数据 2023-11-12 人工智能

1682阅读

Java接入文心一言

文章目录文心一言应用创建接口对接接口文档代码示例依赖常量类实体类结束语文心一言应用创建首先需要先申请文心千帆大模型，申请地址：文心一言 (baidu.com ，点击加入体验，等通过审核之后就可以进入文心千帆...

大数据 2023-11-10 人工智能

1229阅读

LLama 2部署教程+私有模型分发

近日，Meta发布了LLama的最新版本——LLama2，尽管其对中文的处理能力尚有待提升，但其整体表现无疑是令人瞩目的。在发布当天，我便迫切地将其下载下来进行试用，发现相比之前的版本，LLama2在多个方面都实现了显著的进步，特别是在编程能力上的提升更为...

人工智能 2023-11-10 人工智能

1909阅读

大语言模型的七大网络安全热门应用

在这个网络威胁攻防日益失衡的时代，飞速发展的人工智能和大型语言模型(LLM 正成为推动网络安全变革的颠覆性力量。面对新兴威胁，人工智能正推动网络安全转向主动、智能防御。人工智能与人类专业知识的结合才是打造下一代网络安全防御的最佳方式。今天，人工智能...

大数据 2023-11-09 人工智能

795阅读

华为H12-831题库

单选）当IS-IS网络中有多条冗余链路时，可能会出现多条等价路由。关于IS-IS网络内的等价路由，以下哪个描述是错误的? A、当组网中存在的等价路由数量大于通过命令配置的数量，且这些路由优先级相同时，优选下一跳设备System ID大的路由进行负载分担...

AIGC 2023-11-09 人工智能

987阅读

python爬虫入门教程(非常详细)

1、什么是爬虫爬虫指的是一种自动化程序，能够模拟人类在互联网上的浏览行为，自动从互联网上抓取、预处理并保存所需要的信息。爬虫运行的过程一般是先制定规则（如指定要抓取的网址、要抓取的信息的类型等），紧接着获取该网址的HTML源代码，根据规则对源代码进...

大数据 2023-11-09 大数据

880阅读

PHP使用三种方法实现数据采集

从底层的socket到高层的文件操作函数，一共有3种方法可以实现采集。 1. 使用socket技术采集： socket采集是最底层的，它只是建立了一个长连接，然后我们要自己构造http协议字符串去发送请求。例如要想获取这个页面的内容，http:...

生成式AI 2023-11-08 大数据

846阅读

数栈技术分享：带你详解数栈FlinkX实时采集原理与使用

一、FlinkX实时采集功能的基本介绍首先为大家介绍下FlinkX实时模块的分类，如下图所示： 1、实时采集模块(CDC 1）MySQL Binlog插件利用阿里开源的Canal组件实时从MySQL中捕获变更数据。 2）PostgreS...

AIGC 2023-11-08 大数据

861阅读

MySQL server has gone away 问题的解决方法

我的原因是数据库导出之后，从新导入新库sql语句太长 set interactive_timeout=24*3600 mysql出现ERROR : (2006, 'MySQL server has gone away' 的问题意思就是指clien...

人工智能 2023-11-08 大数据

1107阅读

基于TableStore/MaxCompute的数据采集分析系统介绍

摘要在互联网高度发达的今天，ipad、手机等智能终端设备随处可见，运行在其中的APP、网站也非常多，如何采集终端数据进行分析，提升软件的品质非常重要，例如PV/UV统计、用户行为数据统计与分析等。虽然场景简单，但是数据量大，对系统的吞吐量、实时性、分析...

大数据 2023-11-08 大数据

793阅读

MQ对比

MQ分类ActiveMQ 优点:单机吞吐量万级,时效性ms级,可用性高,基于主从架构实现高可用性，消息可靠性较低的概率丢失数据缺点:官方社区现在对ActiveMQ 5.x维护越来越少，高吞吐量场景较少使用。 Kafka 适用场景 Kafka主要特...

大数据 2023-11-08 大数据

1053阅读

抖音数据采集教程，高级版

上一篇文章讲了如何对采集的数据进行抓包和解析，本次主要讲解如何使用自动化工具，实现自动化数据采集。如果想了解抓包和解析部分的内容，可以查阅我的上一篇文章《数据平台初试（技术篇）——抖音数据采集（初级版）》，文末附有上篇文章的传送门。本次用到的工具：移动端自...

AIGC 2023-11-08 大数据

1615阅读

eBPF 实践 -- 网络可观测

简介观测云采集器，是一款开源、一体式的数据采集 Agent，它提供全平台操作系统支持，拥有全面数据采集能力，涵盖基础设施、指标、日志、应用性能、用户访问以及安全巡检等各种场景。通过 eBPF 技术的引入，观测云采集器实践了网络传输层和应用层的部分协议的...

生成式AI 2023-11-08 大数据

1039阅读

#研发解决方案介绍#基于StatsD+Graphite的智能监控解决方案

本文档适用人员：研发和运维员工提纲：监控平台要做到什么程度？为什么要自己做？几个通用技术问题绘图所依赖的数据如何收集？如何加工？如何存储？图形...

大数据 2023-11-08 大数据

863阅读

第二章西门子数控机床采集方案

第二章西门子数控机床采集方案前言一、西门子官方网站介绍二、828D与840D SL介绍三、OPC UA采集方案四、机床端设置 4.1 数控软件版本确认 4.2 V4.05的OPC UA激活设置 4.2.1 设置系统选项 4.2....

生成式AI 2023-11-08 大数据

2177阅读

迈创CoaXPress采集卡安装操作说明

迈创CoaXPress采集卡安装操作说明 MIL软件安装 MIL软件下载获取 MIL软件安装软件使用海康MVS客户端使用 MIL-X软件使用 MIL软件安装 MIL软件下载获取 1.迈创matrox官方下载：Mat...

大数据 2023-11-08 大数据

2656阅读

数据采集及采集工具八爪鱼的使用

数据采集及采集工具八爪鱼的使用一个数据的走势是由多个维度影响的，因此我们需要通过多源的数据采集，尽可能收集到更多的数据维度，公司保证数据质量，才能得到高质量的数据挖掘结果。数据源分类：开放数据源：政府、企业、高校等爬虫获取：网页、APP...

生成式AI 2023-11-08 大数据

1056阅读

Python—WebSocket爬虫实战

1. WebSocket WebSocket 是 HTML5 开始提供的一种在单个 TCP 连接上进行全双工通讯的协议。在 WebSocket API 中，浏览器和服务器只需要做一个握手的动作，然后，浏览器和服务器之间就形成了一条快速通道。两者之间...

大数据 2023-11-08 大数据

883阅读

日志系统之Flume采集加morphline解析

日志系统之Flume采集加morphline解析博客分类： java 概述这段时间花了部分时间在处理消息总线跟日志的对接上。这里分享一下在日志采集和日志解析中遇到的一些问题和处理方案。日志采集-flume log...

AIGC 2023-11-08 大数据

737阅读

网络爬虫：Python如何从网上爬取数据？

网络爬虫，就是按照一定规则自动访问互联网上的信息并把内容下载下来的程序或脚本。在整个的Python爬虫架构里，从基础到深入我分为了10个部分：HTTP、网页、基本原理、静态网页爬取、动态网页爬取、APP爬取、多协程、爬虫框架、分布式爬虫以及反爬虫机制与...

大数据 2023-11-08 大数据

1026阅读

【监控体系】全面系统的Zabbix讲解 | 含源码&监控类型整理

主讲人：王鸿杰，云智慧/企业效能部/架构师讲师简介：云智慧架构师，PHP/PECL 开发组成员，PECL/SeasClick、PECL/SeasLog Maintainer。6 年研发经验，2018 年加入透视宝团队，致力于 APM 产品的架构与研发...

人工智能 2023-11-08 大数据

933阅读

爬虫知识超详细讲解(零基础入门，老年人都看的懂)

1.爬虫是什么？网络爬虫是一种按照一定的规则、自动的抓取万维网信息的脚本或者程序简单来说：爬虫是用事先写好的程序去抓取网络上的数据，这样的程序叫爬虫 2.爬虫的分类按照使用场景来分，可以分为两类：通用爬虫和聚焦爬虫通用爬虫：搜...

人工智能 2023-11-08 大数据

841阅读

Python快速爬虫入门（简洁，高效）

爬虫也许对于大家并不陌生，所谓爬虫，即：一段自动抓取互联网信息的程序，从互联网上抓取对于我们有价值的信息，简单来说就是按照一定的规则，自动地抓取万维网信息的程序或脚本，就比如爬取知乎，百度文库里面的付费内容，抢火车票等各种优惠券，以及爬取vip的音乐视频等...

大数据 2023-11-08 大数据

800阅读

Python爬虫代理池

爬虫代理IP池在公司做分布式深网爬虫，搭建了一套稳定的代理池服务，为上千个爬虫提供有效的代理，保证各个爬虫拿到的都是对应网站有效的代理IP，从而保证爬虫快速稳定的运行，当然在公司做的东西不能开源出来。不过呢，闲暇时间手痒，所以就想利用一些免费的资...

AIGC 2023-11-08 大数据

807阅读

java+如何解决反爬虫_反爬虫，到底是怎么回事儿？

原标题：反爬虫，到底是怎么回事儿？有位被爬虫摧残的读者留言问：「网站经常被外面的爬虫程序骚扰怎么办，有什么方法可以阻止爬虫吗？」这是个好问题，自从 Python 火了起来，编写爬虫程序的门口越来越低，爬取别人网站数据也越来越猖獗。...

大数据 2023-11-08 大数据

798阅读

探索隧道ip如何助力爬虫应用

在数据驱动的世界中，网络爬虫已成为获取大量信息的重要工具。然而，爬虫在抓取数据时可能会遇到一些挑战，如IP封禁、访问限制等。隧道ip（TunnelingProxy）作为一种强大的解决方案，可以帮助爬虫应用更高效地获取数据。本文将探讨隧道ip如何助力爬虫应用...

大数据 2023-11-08 大数据

763阅读

网站数据统计分析之二：前端日志采集是与非

在上一篇《网站数据统计分析之一：日志收集原理及其实现》中，咱们详细的介绍了整个日志采集的原理与流程。但是不是这样在真实的业务环境中就万事大吉了呢？事实往往并非如此。比如针对前端采集日志，业务的同学经常会有疑问：你们的数据怎么和后端日志对不上呢？后端比你们多...

人工智能 2023-11-08 大数据

861阅读

python爬虫的简介

爬虫通俗的概念:通过编写程序，去模拟我们的浏览器,去获取网络之上的相关的数据与信息。 2.爬虫的价值:爬虫的价值在于能够获取网上大量的有价值的信息，加以包装与利用去创造更大的价值。 3.爬虫的原则:不可以妨碍当前网站的正常的运营；不可以去窃取他人受法律...

生成式AI 2023-11-08 大数据

786阅读

OpenTelemetry 项目解读

Opentelemetry Architecture 在 Collector 内部设计中，一套数据的流入、处理、流出的过程称为 pipeline。一个 pipeline 有三部分组件组合而成，它们分别是 receiver/ processor/ expo...

AIGC 2023-11-08 大数据

1050阅读

Prometheus的架构及持久化

##Prometheus是什么 Prometheus是一个开源的系统监控和报警工具，特点是多维数据模型（时序列数据由metric名和一组key/value组成）在多维度上灵活的查询语言(PromQl 不依赖分布式存储，单主节点工作....

生成式AI 2023-11-08 大数据

927阅读

【爬虫】爬虫中登录与验证码处理

本系列为自己学习爬虫的相关笔记，如有误，欢迎大家指正处理登录表单随着Web 2.0的发展，大量数据都由用户产生，这里需要用到页面交互，如在论坛提交一个帖子或发送一条微博。因此，处理表单和登录成为进行网络爬虫不可或缺的一部分。获取网页和提交表单...

AIGC 2023-11-08 大数据

746阅读

大数据系统数据采集产品的架构分析

任何完整的大数据平台，一般包括以下的几个过程：数据采集数据存储数据处理数据展现（可视化，报表和监控）其中，数据采集是所有数据系统必不可少的，随着大数据越来越被重视，数据采集的挑战也变的尤为突出。这其中包括：数据源多种...

AIGC 2023-11-08 大数据

867阅读

爬虫概念与概述

1. 爬虫概述 1.1 爬虫概念爬虫又被称为网页蜘蛛、网络机器人，有时也被称为网页追逐者，是一种按照一定的规则，自动地抓取互联网上网页中相应信息（文本、图片等）的程序或脚本，然后把抓取的信息存储到自己的计算机上。简单来说，爬虫就是抓取目标网站内容...

大数据 2023-11-08 大数据

856阅读

零基础爬虫之http协议

????????? ???????? ???????? ???????? ???????? ???????? ???????? ???????? ???????? ???????? ????? ?? ??????? 作者：不良使 ????? 潜力创作...

生成式AI 2023-11-08 大数据

824阅读

组态王接入多比物联网云平台

一.连接示意图二．组态王环境搭建（整个过程中，请保持数据源的活跃）在需要采集的组态王数据源所在的PC上先安装在两个文件：解压SymBrgOPCClient和SZLog；先安装SQLog,运行install；安装SymBrgOP...

人工智能 2023-11-08 大数据

784阅读

python爬虫1

1.1 网络爬虫概述网络爬虫（又被称为网络蜘蛛、网络机器人，在某社区中经常被称为网页追逐者），可以按照指定的规则（网络爬虫的算法）自动浏览或抓取网络中的信息，通过 Python 可以很轻松地编写爬虫程序或者是脚本。在学习爬虫时不仅需要了解爬虫的实...

人工智能 2023-11-08 大数据

779阅读

爬虫概述

文章目录爬虫相关知识 1.1 爬虫概述 1.2 爬虫语言 1.3 爬虫分类协议 2.1 OSI七层模型 2.2 HTTP协议与HTTPS协议 2.3 服务器常见端口爬虫相关知识 1.1 爬虫概述爬虫, 又称网...

人工智能 2023-11-08 大数据

804阅读

渗透工具—反制爬虫之Burp Suite RCE

一、前言 Headless Chrome是谷歌Chrome浏览器的无界面模式，通过命令行方式打开网页并渲染，常用于自动化测试、网站爬虫、网站截图、XSS检测等场景。近几年许多桌面客户端应用中，基本都内嵌了Chromium用于业务场景使用，但由于开发不...

AIGC 2023-11-08 大数据

886阅读

体验TiDB V6.0.0 之Clinic

作者：边城元元原文来源：https://tidb.net/blog/6b2cf9a8 体验TiDB V6.0.0 之Clinic 一、背景 TiDB的生态越来越完善，带来利好的同时，也增加了运维不可确定性，clinic的出现减...

大数据 2023-11-08 大数据

821阅读

直击 | 认识和了解bboss

1. BBoss是什么 bboss是一个基于开源协议Apache License发布的开源项目，由开源团队bboss运维，主要由以下三部分构成： Elasticsearch Highlevel Java Restclient ，一个高性能高兼容性的...

人工智能 2023-11-08 大数据

1233阅读

微信公众号采集，历史文章采集，万能key采集，点赞阅读评论采集

微信采集的重点就是微信公众号相关的数据、主要是发布的文章、其他的话还有点赞阅读以及公众号的账号信息等。下面会大家一一说明如何采集、以及采集的一些限制。首先是数据来源、主要分为两大块。客户端采集和搜狗微信采集。搜狗微信采集相对来说比较简单，主要解决I...

大数据 2023-11-08 大数据

1141阅读

迈创cameralink采集卡安装操作说明

迈创cameralink采集卡安装操作说明 MIL软件安装 MIL软件下载获取 MIL软件安装 MIL软件安装常见问题 MIL软件安装 MIL软件下载获取 1.迈创matrox官方下载：Matrox Imaging Lib...

大数据 2023-11-08 大数据

1709阅读

云原生在京东丨云原生时代下的监控：如何基于云原生进行指标采集？

从 Kubernetes 成为容器管理领域的事实标准开始，基于云原生也就是基于 Kubernetes 原生。在云的体系下，基础硬件基本上都被抽象化、模糊化，硬故障需要人为干预的频次在逐渐降低，健康检查、失败自愈、负载均衡等功能的提供，也使得简单的、毁灭性的...

AIGC 2023-11-08 大数据

873阅读