数据堂吧
关注: 1,130 贴子: 2,245

数据堂专注于人工智能训练数据服务

  • 目录:
  • 软件及互联网产品
  • 0
    大模型发展日新月异,其超强的内容生成能力已被广泛认可,日益成为人们日常生活和工作学习中名副其实的效率提升工具。但有时面对专业领域的问题,大模型会出现“大模型幻觉”,生成不真实、虚构、不一致或无意义的内容。在近期OpenAI华人科学家翁荔发布的博文中,大模型幻觉也被定义为“不基于所提供的上下文或世界知识所输出的虚构内容”。 目前有许多种方法应对大模型幻觉。大致可分为五个方面: 一是数据增强,既包括无监督学习阶
  • 0
    在数字化浪潮的推动下,金融科技正以前所未有的深度和广度改变着金融行业的面貌。随着人工智能技术的不断成熟与大数据应用的深化,一场由智能机器人引领的金融变革正在悄然上演。近日,某大型商业银行携手科技巨头及创新企业,在权威机构的支持下,共同宣布启动“智能金融机器人创新实践中心”,该中心不仅集成了最前沿的智能机器人技术,还深度融合了大数据分析能力,旨在打造金融服务的全新模式与体验。 场景为王,技术为翼,驱
  • 0
    随着人工智能(AI)技术的飞速发展,全球科技巨头纷纷布局,旨在探索AI的无限潜力与边界。在这一浪潮中,一家领先的AI研究机构近期公布了其内部对AI发展进程的详细分级体系,旨在为员工、投资者及社会各界提供一个清晰的理解框架,关于AI如何逐步从简单的对话互动迈向能够组织复杂任务的高级形态。同时,这一分级体系也隐含了对未来AI技术与应用融合趋势的深刻洞察,其中,数据作为AI进步的基石,其重要性不言而喻,尽管在标题中未直接
  • 0
    近年来,人工智能(AI)高速发展,在自动驾驶、生成式AI等多个应用领域,开发技术路线和流程逐渐走向趋同。同样,在“数据”“算法”“算力”三要素中,人们也逐步发现,在算法不能决出明显区分度的情况下,数据质量愈发成为提升AI效果,决定AI产品“胜负”的关键所在。 面对如何提升数据质量这一庞大命题,身处产业链不同站位的企业也有着不同的关注方向和解决策略。在此,我们愿意抛砖引玉,分享我们的洞察。 挑战:算法工程师与标
  • 0
    在当今这个技术日新月异的时代,AI(人工智能)的崛起如同一股不可阻挡的洪流,既带来了前所未有的机遇,也引发了深刻的反思与忧虑。人们担心AI会抢走工作,让社会陷入更深的困境;而另一群人,则在探索AI如何成为解决现实难题的钥匙,特别是在那些被长期忽略的“小场景”中。在这场关于AI与人为敌还是为友的辩论中,一个不可忽视的力量正在悄然发挥作用——那就是通过高质量数据服务推动AI技术进步的企业,比如那些虽未直接提及,但
  • 0
    引言 人工智能产业飞速发展,技术不断实现创新突破的同时,对数据服务能力的要求也在不断提升。这其中,超大型、高难度的数据定制项目开始不断涌现,对项目数据质量管理的要求和难度也提升至新高度。 数据堂凭借多年的行业经验积累优势,持续优化提升自身数据质量管理方案,确保质量管理能力与客户实际需求相匹配,并通过深入准确理解客户需求、动态调整质量管理策略、设立独立质控部门、践行“慢即是快”的质量管理理念的四大举措
  • 0
    近期,OpenAI正式发布大模型GPT-4升级版——GPT-4o,并已对注册用户开放使用。在演示中,具备“听、看、说”能力的GPT-4o凭借快速、自然且富有同理心的亮眼回答,引起了全网的广泛关注和好评。 GPT-4o支持语音输入,模型效果实现飞跃式提升 本次发布最为亮眼的就是GPT-4o同时处理文本、语音和图像三种模态的强大能力。其中,GPT-4o的语音输入效果最为突出,特别体现在以下两方面。 一是GPT-4o接近人类的响应速度。现在的 GPT-4o 可以在最短232毫秒内响
  • 0
    5月24日至25日,第七届数字中国建设峰会召开,中国移动在峰会期间举办以“AI赋能,智筑国基”为主题的人工智能生态大会,数据堂应邀出席。 期间,数据堂携手中国移动和十余家头部企业、重点高校和科研机构,共同发布《“弈衡”大模型评测平台白皮书》(简称 “白皮书”)。 5月24日至25日,第七届数字中国建设峰会召开,中国移动在峰会期间举办以“AI赋能,智筑国基”为主题的人工智能生态大会。 国务院国资委副主任苟坪,福建省委常委、
  • 0
    5月25日,在第七届数字中国建设峰会•智算云生态大会期间,中国电信于福州举办数据要素论坛。本次论坛以“筑基提质 数创未来”为主题,发布了中国电信“数链智网”数据要素能力体系及白皮书系列,成立中国电信数据要素产业联盟CTDIA2024,启动“聚星行动”生态合作伙伴招募计划,旨在与生态合作伙伴携手并进,共同推进数据要素价值释放,助力数字中国建设。 国家数据局数据资源司副司长宋宪荣、中国电信副总经理栾晓维等出席论坛并致辞
  • 0
    近日,由中国自动化学会主办,中国仪器仪表行业协会、全国机械安全标准化技术委员会、全国工业过程测量控制和自动化标准化技术委员会协办,控制网(http://www.kongzhi.net)&《自动化博览》、OICT学院承办的2024中国自动化产业年会暨第十九届中国自动化产业世纪行活动(CAIAC 2024)在北京隆重举行。 自2006年至2024年,中国自动化产业年会暨中国自动化产业世纪行活动历经十九年积淀,已发展成为了业内首屈一指的行业盛会。活动当晚,有200余位引领中
  • 0
    大模型由于其强大的自然语言与多模态信息处理能力,可以应对不同语义粒度下的任务,进行复杂的逻辑推理,还具有超强的迁移学习和少样本学习能力,可以快速掌握新的任务,实现对不同领域、不同数据模式的适配,这些特点使得大模型较容易的赋能其他行业,提升行业效率。 教育:2023年至今,全球教育科技公司积极布局教育领域大模型,网易有道发布面向K12教育的大模型“子曰”,实现个性化分析指导、引导式学习等功能,好未来发布数学领
  • 0
    引言 随着AI大模型的发展,由Open AI引领的ChatGPT热潮已经展现出了强大的实力。文本大模型在近期取得了突飞猛进的成果,而语音合成大模型也在近些年发生了非常快的迭代。 不同于传统语音合成所面临的挑战,如缺乏人声自然度、情感化表达能力,生成音色的可扩展性低、难以满足不同场景的多样化需求,复刻素材所需成本高且耗时长等多方面因素。 Part1 目前,语音合成大模型在音质、断句气口、韵律节奏、风格、感知等多个方面都达到了更生动
  • 0
    1、新人小白尤其是想组团队的,没有靠谱的上游资源,别去搞大了。加盟费就他么是套路。在这就不点名了,那些收加盟等的自己心里有点B数。 2、结款周期是团队运作的根本,除非你就想当韭菜,用钱去铺路。你必然会买到教训和经验。 3、已经加盟的,你觉得你的任务多吗?但凡收取加盟费的,不会把任务都给你,因为他还要把任务分配给其他加盟的人,不会都给你。 4、一顿被洗脑,告诉你成熟10人团队让你月入过万。那他么是以前。 凡事各位
  • 0
    数据堂受邀参加联通2024生态合作伙伴大会并荣获卓越合作伙伴奖 2月28日,联通(广东)产业互联网有限公司(以下简称:联通广东产互公司)在广东联通新时空大厦召开2024年生态合作伙伴大会。本次大会以“聚力同行,联通未来”为主题,汇聚了包括数据堂(北京)科技股份有限公司(以下简称:数据堂)在内的160余家互联网公司、终端厂商等产业链上下游合作伙伴以及270余名行业精英。 联通广东产互公司在大会上展示了其开放融合的胸怀,致力于
  • 0
    OpenAI文生视频模型Sora的横空出世,即刻引起业内广泛的关注和讨论。A股AI板块各股掀起了涨停潮,AIGC概念、Web3.0等板块涨幅居前。Sora相关新闻快速登上了新闻头条,央视也针对Sora进行了报道。 01 Sora的创新表现 继文本、图像之后,OpenAI在视频领域进行了又一技术拓展。其推出的全新人工智能模型Sora通过文本指令,即可直接输出长达60秒的视频内容,背景逼真,细节还原,转场细致,角度惊艳,画面逼真到难以区分虚拟还是现实。 同样的提示词,与
  • 0
    近日,世界卫生组织发布的多模态大模型治理相关新指南指出,人工智能在医疗卫生领域应用前景广阔。 随着人工智能不断赋能医疗健康领域,改变医疗模式的同时,极大提升了医疗服务质量。那么,智能医疗与我们的数据产品又有什么样的联系呢?来看一下数据堂近期在智能医疗领域中提供了哪些数据产品服务吧! 案例一:踝关节正常骨与骨折骨标注 项目概述 企业通过建立基于深度学习算法的目标物体检测模型,实现手部、足部、腕关节、脚踝
  • 0
    企业动态:数据堂成为区块链技术与数据安全工业和信息化部重点实验室成员单位 2023年,区块链技术与数据安全工业和信息化部重点实验室(以下简称“实验室”)大力推动数字技术与实体经济深度融合,探索数字技术赋能新型工业化发展,在推动区块链、隐私计算、人工智能等Web3.0关键技术融合创新、标准研制、应用落地等方面取得积极成果。 产学研用各方合作伙伴积极参与实验室基础科研、试验验证、学术交流等工作,经自愿申报与内部审查,
  • 0
    迄今为止,全球英语口音已演化多达60余种,这主要是因为全世界使用英语的人口当中,有3亿人以英语为母语,3亿人以英语为第二语言,或必要时以英语与人交谈,间接导致了不一样的国家说英语的方式不同。 随着科技的进步,语音识别技术已经渗透到生活的方方面面,然而,面对带口音的英语,通用的英文语音识别模型的鲁棒性及准确率都会有明显下降。 AI听不懂?可能是数据的问题 为了让模型能够更准确理解全球不同国家英语发音人想表达的内
  • 0
    迄今为止,全球英语口音已演化多达60余种,这主要是因为全世界使用英语的人口当中,有3亿人以英语为母语,3亿人以英语为第二语言,或必要时以英语与人交谈,间接导致了不一样的国家说英语的方式不同。 随着科技的进步,语音识别技术已经渗透到生活的方方面面,然而,面对带口音的英语,通用的英文语音识别模型的鲁棒性及准确率都会有明显下降。 AI听不懂?可能是数据的问题 为了让模型能够更准确理解全球不同国家英语发音人想表达的内
  • 0
    斯坦福大学李飞飞等人在2022年8月发表的论文中指出,实现可信AI,数据的设计、改进和质量评估是关键。以数据为中心的人工智能将重点转移到训练数据的治理和增强,高质量的训练数据集、完备的数据应用策略将会更好的服务于模型的开发与应用。 大模型的热潮为人工智能开启了新的篇章,作为人工智能的重要生产要素,数据集的作用更加凸显。然而,飞速发展的大模型时代,训练数据供需两端也在发生转变,适配于大模型领域的数据处理工具应
    数据堂BJ 12-14
  • 0
    医疗健康是人工智能率先落地的行业之一。据统计,到2030年,全球医疗Al市场规模有望达到1879.5亿美元。目前,AI已经在辅助诊断、药物开发、数据管理、临床决策等多个医疗健康领域取得明显成果。 通过AI赋能,一方面可以提高医疗效率、降低成本;另一方面可以提高医疗质量,为患者带来更好的治疗效果与诊疗体验。 数据堂面向诊疗端、药品研发、科学护理等环节提供高质量的数据服务与专业化的标注工具。本期案例我们将分享多种类型的医疗数
    数据堂BJ 12-13
  • 0
    如此高自然度、智能度的人机交互方式逐渐进入我们生活,人们对机器给予的情感表现力以及个性化能力需求明显提高,为了赋能大模型时代的AI语音交互,数据堂快速升级个性化语音合成数据服务能力,帮助客户增强音色保真度和情感表达的需求,以满足虚拟人、有声阅读、短视频和智能客服等多种应用场景需求。 多模态语音合成指的是在传统的声音感知模态基础上,增加了通过面部捕捉达成的视频感知模态。数据堂依托语音、视觉方面多年的数据
    数据堂BJ 11-28
  • 0
    基于BEV的4D标注 4D-BEV标注技术将数据标注引入了第四维度,即时间序列。这种技术基于鸟瞰图,标注人员可在其中对车辆、行人、交通标志等静态物体进行标注,并记录它们的位置、大小等信息。同时,时间轴标注也记录了物体的进出时间,帮助算法更准确的跟踪物体运动轨迹,从而提高自动驾驶的安全性和决策支持。 ▲ 数据堂4D标注工具 为了帮助客户可以更快速、更低成本构建大量高质量4D-BEV真值数据,用于感知的训练和评价,数据堂推出4D-BEV标
    数据堂BJ 11-28
  • 0
    近日,北京市经济和信息化局举办了AIGC产业链专精特新企业融通路演活动,并正式发布《AIGC产业链北京市专精特新企业图谱》(以下简称《图谱》),数据堂作为数据层的代表企业,凭借AIGC领域高质量的数据服务成功入选。 《图谱》显示,在AIGC产业链领域,北京市走在全国前列,在算力、数据、场景、投资、人才等方面优势显著,并有57家优质专精特新企业处在重要产业节点,其中算力层14家、数据层11家、模型层10家、应用层22家。 据北京市经济
    数据堂BJ 11-20
  • 0
    2023年7月21日上午,北京市科委、中关村管委会二级巡视员刘航、北京信息科技发展中心主任李顺超、北京信息科技发展中心项目主管工程师廖原一行莅临数据堂总部参观调研,考察并听取了数据堂基本发展情况,并就人工智能数据领域的数据标注、数据合规、联邦数据、大模型训练数据、人工智能评测等相关技术进行交流研讨。数据堂首席运营官何鸿凌出席并主持会议,数据堂首席数据官丰强泽、数据科学家王大亮、政府事务中心经理孟凡龙等陪同
    数据堂BJ 11-15
  • 0
    8月20日-24日即将迎来国际性语音及语言科学技术领域盛会——INTERSPEECH 2023。INTERSPEECH会议成立于1990年,最初名为EUROSPEECH。该会议旨在促进语音及语言科学技术的交流、合作和发展,吸引了众多来自全球学术界和工业界的专家、学者和从业者参与其中,逐渐成为国际性语音及语言科学技术领域的顶级会议之一。自创办以来,该会议先后在欧洲、亚洲、北美洲、南美洲等地多个国家的主要城市成功召开,本次盛会将在有着“欧洲硅谷”之称的爱尔兰举办
    数据堂BJ 11-15
  • 0
    在7月6日举行的2023全球数字经济大会“知识产权与数字经济发展论坛”上,北京市首批数据知识产权登记证书颁发。在本次论坛上,数据堂作为国内领先的人工智能数据服务企业,获颁首批数据知识产权登记证书。 数据是数字经济发展的关键要素,而数据产权制度是加快数据高效流转,促进数据价值实现的重要制度基础。今年5月,北京市知识产权局等4部门联合印发了《北京市数据知识产权登记管理办法(试行)》,规范登记行为,明确登记事项,推
    数据堂BJ 11-14
  • 0
    6月2日下午,北京市知识产权局党组成员、副局长潘新胜一行赴数据堂(北京)科技股份有限公司调研数据知识产权相关工作。国家知识产权局数据知识产权工作指导专家组专家、数据堂创始人兼CEO齐红威以及核心团队人员参加座谈。 数据堂创始人及CEO齐红威博士与北京市知识产权局领导合影留念 数据堂CEO齐红威介绍了数据堂数据业务发展及运营情况现状,详细说明了公司对数据相关权益的保护情况,并结合公司实际提出了数据知识产权保护相关需
    数据堂BJ 11-14
  • 0
    7月2日,“2023全球数字经济大会人工智能高峰论坛”在京举办。本次论坛以“智能涌现,重塑未来”为主题,汇集10余位人工智能领域顶级专家学者和企业、机构代表围绕当下最具热度的大模型发展话题分享了深刻洞见和思考。 本次论坛发布了首批“北京市人工智能大模型高质量数据集”,共有10家单位的18个高质量训练数据集入选,包括数据堂多语言多模态视频文本对齐数据集、中文高质量大模型预训练文本数据集,以及人民日报语料数据集、国家
    数据堂BJ 11-13
  • 0
    5月27日,由中国政法大学数据法治实验室与知产财经联合主办的“首届数据权益保护实务论坛”在北京召开。会议邀请了来自学术界、司法界、产业界等代表围绕数据权益相关话题展开交流和研讨。 作为参与编写“数据二十条”的一员,数据堂创始人兼CEO齐红威博士受邀参与本届论坛,并在圆桌会议中表达了数据基础制度建设事关国家发展和安全大局,要充分发挥我国海量数据规模和丰富应用场景优势,激活数据要素潜能。在数据要素市场蓬勃发展
    数据堂BJ 11-13
  • 1
    申请人:@数据堂BJ 申请感言:维护贴吧秩序
  • 0
    手势识别技术是一种通过计算机视觉和人工智能技术来分析和识别人类手势动作的技术。它主要利用传感器、摄像头等设备捕捉手势信息,然后通过算法对捕捉到的手势信息进行处理和分析,从而实现对手势的识别和判断。 手势识别技术可以分为两种类型:基于传感器的手势识别和基于视觉的手势识别。基于传感器的手势识别技术主要利用加速度计、陀螺仪等传感器来捕捉手势信息,并通过算法对捕捉到的手势信息进行分析和识别。而基于视觉的手
  • 0
    手势识别技术在实现过程中面临着一些挑战和问题。 首先,手势识别技术需要处理大量的手势信息,而这些手势信息的处理和分析需要耗费大量的计算资源,因此如何提高计算效率是手势识别技术需要解决的问题之一。其次,手势识别的准确率受到多种因素的影响,如光照、背景、手势速度等,如何消除这些因素的影响是手势识别技术需要解决的问题之一。此外,由于手势识别技术涉及到个人隐私等方面的问题,如何保护个人隐私也是手势识别技术
  • 0
    城市精细化治理任务旨在通过人工智能(AI)技术对城市治理过程中出现的问题事件(例如道路破损、垃圾乱放、占道经营等)进行智能图像识别,为城市治理人员针对性开展工作提供技术支持。 城市精细化治理任务难点主要在于真实城市场景的背景复杂性和事件中具体目标的复杂性。 真实城市背景复杂性: 在城市不同位置、不同视角下图像中的目标种类、位置、形态大不相同,例如小巷、城市主干道、街边商户等都具有完全不同的目标分布,给算
  • 0
    近期,中文通用大模型综合性评测基准SuperCLUE正式发布。科大讯飞研发的星火认知大模型则位列总榜第三、国内第一。
  • 0
     随着人工智能的发展,机器人技术不断地应用到各个领域。信息技术的加入是智能机器人出现的必要前提。信息技术泛指包括通信技术、电子技术、信号处理技术等相关信息化技术的一大类技术。它的应用使得人们今天的生活发生了巨大变化。从手机到高清电视等家用电器设备出现使我们的生活越来越丰富多彩。在一些军用及民用领域近几年出现了一些诸如:图像制导、无人飞机、无人巡逻车、人脸识别、指纹识别、语音识别、车辆牌照识别、汉字
  • 0
    近年来,自动驾驶领域的各项下游任务基本上都要求了对场景的语义理解,比如自动驾驶车辆要能够理解哪个是路面、哪个是交通灯、哪个是行人、哪个是树木,因此点云分割的作用就不言而喻。但随着Transformer模型的大火,用于点云分割的深度神经网络的参数量越来越庞大,动不动就上亿参数。想要训练如此庞大的模型,除了需要足够强的GPU外,还需要大量的标签和数据。数据很容易得到,64线的激光雷达一帧可以打出十几万个点云,现有的雷达数
  • 0
    随着数据时代的到来,人们越来越多的关注计算机领域,当然,我们也因为计算机的发展让我们生活更加的智能化、数据化。慢慢的人们感觉到计算机技术所带来的便利的甜头,不断的提高计算机技术,人工智能无疑不展示人类对自然科学强大的控制欲。为了应对人们越来越高的生活需求,希望人工智能能够很好的解决人们的生活、工作上的一些问题。人工智能涉及多个心理学、语言学等学科,通过不断校正而实现对人们整个身心状态的模仿,进而可
  • 0
    如今,人工智能早已经在我们的生活中屡见不鲜,然而作为人工智能的上游基础产业,数据标注却鲜为人知。如今,数据标注已经是一个极为庞大的产业,不仅在人工智能方面有着及广的应用,并且创造了大量新兴的就业机会。那么,数据标注到底在哪些方面有应用,他又为什么会如此火热?1、智能交通数据应用行车视频采集,路况信息提取,包括3D点云障碍物、红绿灯、车道灯及高精地图。为行人识别、车辆识别、红绿灯识别、车道线识别等技术提
  • 0
    自动驾驶,近几年汽车领域最火热的风口之一。麦肯锡最新研究报告显示,至2030年,中国自动驾驶相关的新车销售及出行服务创收将超过5000亿美元。 传统主机厂、互联网巨头、出行公司纷纷拥抱市场、卡位圈地。大量创业者也带着华丽丽的PPT一股脑儿地涌入自动驾驶行业,各自都在说着自己的精彩故事。在他们身后,资本的力量不断加码。根据中国电动汽车百人会的统计,2015年到2017年11月,自动驾驶汽车相关领域的投融资事件共193起,金额达1438亿
  • 0
    自动驾驶汽车将是汽车发展的最终目标,将是实现智能交通、智能城市重要的一环,自动驾驶汽车即通过加装在汽车上的毫米波雷达、激光雷达、车载摄像头等硬件感知设备,配合高精度地图、深入学习等技术的使用,可以让汽车在没有驾驶员控制的情况下,独自实现出行过程。 现阶段自动驾驶技术如火如荼地发展,无论是主车厂,还是互联网企业,抑或是传统制造企业,都希望能在自动驾驶汽车发展初期,市场布局尚未稳定时,提前布局、提前研
  • 0
    我国要在人工智能领域取得应有的话语权,就得在人工智能基础理论和前沿技术方面加强引领性原创科学研究,并率先取得重大突破。相对于欧美国家,我国人工智能研究起步晚,又长期处于低门槛,具有国际影响力的人才稀缺,掌握“撒手锏”技术的高水平人才更十分匮乏,尚需建设完备的人工智能人才体系。“青藏高原上才有珠穆朗玛峰”,只有在尖端技术研究平台上才能培养出顶尖技术人才。而建设一大批具有国际水平的研究组,是培养顶尖人

  • 发贴红色标题
  • 显示红名
  • 签到六倍经验

赠送补签卡1张,获得[经验书购买权]

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!

本吧信息 查看详情>>

会员: 会员

目录: 软件及互联网产品