数据训练第5页 - AIGC资讯

15种工商数据的采集方法

目录 15种工商数据的采集方法 1、目前常用的15种数据网站 2.如何写Python爬虫：（1）爬虫的流程描述：（2）爬虫需要解决问题：（3）写爬虫需要安装的环境和工具： 3.人生第一个爬虫代码示例：另外：...

大数据 2023-11-08 大数据

1380阅读

2011年时谷歌DeepMind联合创始人Shane Legg曾预言，2028年之前AI有50%的概率可能会变得和人一样聪明。最近Shane Legg接受采访，他强调自己的观点未变，依然认为研究人员有50%的概率实现通用人工智能（AGI，又叫强人工智能...

人工智能 2023-11-07 人工智能

768阅读

最近微软一项研究让Llama 2选择性失忆了，把哈利波特忘得一干二净。现在问模型“哈利波特是谁？”，它的回答是这样婶儿的：木有赫敏、罗恩，木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的，比如给它一个看似非常普通的提示“那年秋天，哈...

人工智能 2023-11-07 人工智能

722阅读

北京大学董豪团队具身导航最新成果来了：无需额外建图和训练，只需说出导航指令，如： Walk forward across the room and walk through the panty followed by the kitchen. Stan...

人工智能 2023-11-06 人工智能

873阅读

GPT-3究竟是如何进化到GPT-4的？字节给OpenAI所有大模型来了个“开盒”操作。结果还真摸清了GPT-4进化路上一些关键技术的具体作用和影响。比如： SFT是早期GPT进化的推动者帮助GPT提升编码能力的最大功臣是SFT和RLHF 在...

AIGC 2023-11-05 人工智能

803阅读

多数CIO已经开始探索GenAI，以确保企业跟上技术发展的趋势，但许多人发现，市场上的技术还没有达到理想的水平。米其林全球CIO Yves Caseau表示：“在对GitHub Copilot和ChatGPT进行了六个多月的试验后，GenAI的发展速度令...

AIGC 2023-11-02 人工智能

825阅读

机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。毫无疑问，机器学习/人工智能领域在将来是越来越...

AIGC 2023-11-02 人工智能

986阅读

AI巨佬Geoffrey Hinton称，「科技公司们正在未来18个月内，要使用比现在GPT-4多100倍的算力训练新模型」。更大参数的模型，对算力需求巨大的同时，对数据也提出了更高的要求。但是，更多的高质量数据该从何来？英伟达高级科学家Jim F...

AIGC 2023-10-30 人工智能

842阅读

大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更...

AIGC 2023-10-28 人工智能

1028阅读

随着人工智能（AI）技术的快速发展，其训练数据的获取和使用变得日益重要，但也出现了滥用现象。为了抵御这种滥用，一款名为「Nightshade」的新工具应运而生，为创作者提供了一种保护他们创意作品不被无授权用于 AI 模型训练的方法。 Nightshade...

AIGC 2023-10-26 人工智能

874阅读

艺术家对AI侵权的反击来了—— 在画作里“投毒”，AI用了就会“中毒”出故障。投毒工具由芝加哥大学团队打造，名为Nightshade，可以对画中像素添加隐形更改。被下毒的画一旦被非法抓取成为训练数据被AI吃掉，模型就会生成混乱。甚至还可能会破坏DA...

人工智能 2023-10-24 人工智能

879阅读