方言语音识别:让智能设备听得懂你的方言

2023-05-14
阅读 1 分钟
558
随着全球化的发展,中国方言语音识别技术的研究越来越受到重视。方言是中国特有的文化现象,但由于其语音特点和使用范围的限制,传统的语音识别技术难以应用于方言语音的识别。因此,方言语音识别技术的发展成为了当前语音识别技术的研究热点之一。

数据采集在现代科技中的应用与挑战

2023-05-12
阅读 2 分钟
206
随着科技的不断发展,数据采集已经成为了现代科技中不可或缺的一部分。数据采集可以为公司、产品或人员提供有用的信息,帮助他们更好地了解市场、用户需求和自身情况。本文将重点介绍数据采集在现代科技中的应用和挑战,包括传感器技术、设备监控技术、人工输入技术和自动化技术等。

语义分割标注:从认知到实践

2023-04-28
阅读 1 分钟
710
随着人工智能技术的不断发展,语义分割标注已经成为计算机视觉领域的一个热门话题。语义分割是指将图像中的每个像素分配给一个预定义的语义类别,以便在计算机视觉应用中进行分类和分析。标注语义分割的图像可以帮助计算机视觉系统更好地理解和分析图像中的内容,并在许多任务中取得更好的性能。

人脸识别:现代科技与隐私保护的博弈

2023-04-28
阅读 2 分钟
342
人脸识别技术作为一项现代科技,已经深入我们的日常生活,包括我们的社交、购物、银行等场景。与此同时,这项技术也引发了广泛的关注和争议,特别是在隐私保护方面。在这篇文章中,我们将探讨人脸识别技术的发展历程、应用场景、隐私保护问题以及未来发展趋势。

人工智能训练数据集:误区、挑战与应对方法

2023-04-27
阅读 2 分钟
233
人工智能训练数据集是人工智能技术发展中至关重要的一环。然而,在构建和使用数据集时,我们常常会遇到一些误区和挑战,这些问题可能会影响数据集的质量和使用效果。本文将探讨人工智能训练数据集的误区、挑战以及应对方法。

人工智能训练数据集:基础与发展

2023-04-26
阅读 1 分钟
185
作为人工智能领域的基础,训练数据集对于模型的训练和优化至关重要。在过去的几十年中,随着计算机技术和硬件性能的不断提升,人工智能技术得到了快速的发展,但是训练数据集作为基础部分,却一直是制约其发展的重要因素之一。在过去的几年中,为了解决这一问题,研究人员和企业投入了大量的资源和精力,构建了许多不同...

手势识别:让你的手成为计算机的新界面

2023-04-25
阅读 1 分钟
229
势识别是一种新兴的人机交互技术,它通过识别人类手部的动作和姿态,来控制计算机或其他设备,从而实现更加自然和直观的人机交互。手势识别技术不仅可以用于操作计算机、移动设备等,还可以用于人机交互、虚拟现实、智能家居等领域,极大地拓展了人类的智能和控制范围。手势识别技术的实现需要借助各种传感器和识别算法...

手语识别:解锁语言交流的新时代

2023-04-24
阅读 1 分钟
329
手语识别是一种新兴的技术,它通过识别人类手部的姿态、运动和形状,来理解人类的意图和情感,从而实现计算机与人类之间的自然交流。随着人口老龄化和全球化的趋势,手语识别技术正日益受到关注,它不仅能帮助那些因为残疾、疾病或文化差异而无法用口语表达自己的人们,更能为人类的交流和理解带来更广阔的空间。手语识...

专业的语音数据服务和优势帮助提升AI算法模型准确率

2023-04-23
阅读 1 分钟
598
数据堂专注于AI数据生产,拥有大量的语音数据资源,涵盖了各种不同场景下的语音数据,包括普通话、方言、英语、日语、韩语、泰语、印地语等多个国家的语言。这些数据被广泛应用在车载语音、智能客服、智能音箱等人工智能产品的落地。拥有国际领先的自主核心数据处理技术,已实现基于“Human-in-the-loop”技术进行大规模的...

《自动驾驶技术中的点云数据标注》

2023-04-23
阅读 1 分钟
340
点云数据标注是自动驾驶技术中的一个关键环节,它可以提高点云数据的质量和可用性,并为后续的自动驾驶车辆的建模和仿真提供有效的数据支持。本文将从数据预处理、特征提取、标注框架、标注数据、质量检查和可视化等方面,详细介绍点云数据标注的步骤和注意事项。

人脸识别数据集:训练和测试计算机视觉算法的宝贵资源

2023-04-23
阅读 1 分钟
220
人脸识别数据集是指用于训练和测试人脸识别算法的数据集合。在计算机视觉和人工智能领域,人脸识别数据集是一个非常重要的资源,因为它们可以用于训练和测试各种人脸识别算法,包括深度学习算法和传统的机器学习算法。

语义分割数据集:从理论到实践

2023-04-23
阅读 1 分钟
227
语义分割是计算机视觉领域中的一个重要问题,它的目标是将图像或视频中的语义信息(如人、物、场景等)从背景中分离出来,以便于进行目标检测、识别和分类等任务。语义分割数据集是指用于训练和测试语义分割算法的数据集合。本文将从语义分割数据集的理论和实践两个方面进行介绍。

优质的人工智能语音数据标注能力

2023-04-23
阅读 1 分钟
250
随着人工智能技术的迅猛发展,语音数据标注变得越来越重要。语音识别、语音合成等研究领域需要大量的语音数据,并且这些数据必须被准确地标注。然而,语音数据标注是一项十分繁琐和耗时的工作,需要专业的团队和优秀的技术。

【ECCV 2022】76小时动捕,最大规模数字人多模态数据集开源

2023-03-10
阅读 4 分钟
325
随着元宇宙的火爆以及数字人建模技术的商业化,AI 数字人驱动算法,作为数字人动画技术链的下一关键环节,获得了学界和工业界越来越广泛的兴趣和关注。其中谈话动作生成 (由声音等控制信号生成肢体和手部动作)由于可以降低 VR Chat, 虚拟直播,游戏 NPC 等场景下的驱动成本,在近两年成为研究热点。然而,由于缺乏开源...

数据推荐 | 人体行为识别数据集

2023-03-03
阅读 2 分钟
813
以活动的关节点扩展。标签标注主要标注该动作对应的行为类别,是对人体行为的整体描述。人体行为通常分为静态行为和动态行为,具体标注形式如下: 静态行为:直接对图像中的目标人体进行关键点标注,并对整体行为种类做标签标注。动态行为:对于动态行为,还需增加视频抽帧模块,对动态人体行为视频基于特定的采样率抽取...

INTERSPEECH 2022 | 价值30万自然对话语音数据免费送

2022-09-16
阅读 1 分钟
347
由国际语音通信协会ISCA组织,全球最大的综合性语音信号处理领域的科技盛会之一INTERSPEECH,将于2022年9月18日-22日在韩国仁川迎来第23届以“Human and Humanizing Speech Technology”为主题的会议。

数据推荐 | 自然场景OCR文字识别数据集一览

2022-09-09
阅读 3 分钟
478
自然场景OCR任务介绍文字识别(optical character recognition,OCR)是指例如扫描仪或数码相机的电子设备检查图像中的字符,然后用字符识别方法将形状翻译成计算机文字的任务。OCR应用场景比较丰富,包括自然场景、手写场景、文档识别等。作为OCR任务中应用最广泛、具备巨大市场需求的场景之一是自然场景OCR。自然场景...

智能座舱行为识别数据解决方案,助力打造第三空间新体验

2022-09-02
阅读 3 分钟
452
智能座舱关注车内感知,通过在车内安装摄像头感知驾驶员和乘客的行为以及车内状况。座舱行为识别任务旨在识别车辆座舱中驾驶员及乘客的行为,改善驾乘体验提供技术支持,以提供驾驶员和乘客更好的驾乘体验和更安全的行车保障。

融合与创新:数据堂骨龄标注工具为医生赋能

2022-09-02
阅读 2 分钟
434
骨龄是评价青少年儿童生物年龄的主要方法,骨龄与实际年龄并不是必须一致的,骨龄检查可以了解骨骼的发育情况,判断骨龄发育迟缓还是过速,了解身材过矮的原因以及预后。在临床医学、法医学和运动医学等领域中有广泛的用途。

CVPR 2022 | 数据堂亮相计算机视觉领域盛会

2022-08-26
阅读 1 分钟
345
一年一度全球顶级的计算机视觉领域盛会 IEEE / CVF Computer Vision and Pattern Recognition Conference(以下简称“CVPR”)于6月19日在美国路易斯安那州新奥尔良拉开帷幕。作为计算机视觉领域的顶级会议,CVPR每年都会吸引大量来自全球人工智能、计算机视觉以及机器学习领域的专业人士。

通用场景语音合成数据集推荐

2022-08-26
阅读 2 分钟
439
语音合成,通常又称文语转换(Text To Speech,TTS),是一种可以将任意输入文本转换成相应语音的技术,是人机语音交互中不可或缺的模块之一。传统语音合成传统的语音合成系统通常包含前端和后端两个模块。前端模块主要是对输入文本进行分析,提取后端模块所需要的语言学信息。对中文合成系统来说,前端模块一般包含文本...

转载 | 自动驾驶开源数据集总结

2022-08-19
阅读 11 分钟
673
前言数据是人工智能时代的石油,随着汽车行业的发展、自动驾驶商业场景的落地,自动驾驶算法变得尤为重要,想要打磨自动驾驶算法,就需要大量的场景数据支撑。作者对过去使用、积累的自动驾驶开源数据集做了总结,以下45个自动驾驶开源数据集供大家参考。​4Seasons题目:4Seasons: A Cross-Season Dataset for Multi-Wea...

活体检测再升级,3D头模数据增强“刷脸”保护罩

2022-08-19
阅读 2 分钟
243
如今,人脸识别技术在各行各业中的应用越来越广泛。随着人脸识别系统给人们日常生活带来便利的同时,也面临着各类人脸欺诈攻击,随之而来的技术安全性也愈发受到重视。如何区分真实人脸与虚假人脸,对于人脸识别系统的安全具有十分重要的意义。​常见的人脸欺诈攻击行为常见的人脸欺诈攻击方式包括打印人脸照片、屏幕播放...

数据集 | 语音合成音库助力机器人客服“声入人心 ”

2022-08-09
阅读 2 分钟
399
“尊敬的用户您好,如需办理业务请按1,办理业务请按2...或者您可通过自助语音或关注某某公众号等自助渠道办理相关业务...”联系过客服的人,这句话一定不陌生。早期智能客服使用的语音合成技术属于播音式风格,音质“机械感”浓重,音色损失大、刻板、语速不够流畅自然,无法做到高度拟人化,用户听多了容易产生听觉疲劳。...

万字长文!DeepMind科学家总结2021年的15个高能研究

2022-08-03
阅读 6 分钟
393
2021年借助更强大的算力、数据和模型,ML和NLP依然发展迅速,DeepMind科学家最近总结了过去一年的十五项亮点研究方向,快来看看哪个方向适合做你的新坑!  最近,DeepMind科学家Sebastian Ruder总结了15个过去一年里高能、有启发性的研究领域,主要包括: Universal Models 通用模型Massive Multi-task Learning 大规模...

谷歌公开自动驾驶新专利:通过眼睛注视向量,精确判断注意力

2022-07-21
阅读 1 分钟
342
当前,我们正处在智能驾驶技术迅速发展的时代,具有智能驾驶、辅助驾驶功能的车辆正变得越来越普遍。但是,当前智能驾驶技术尚不完善,一些功能如果完全智能驾驶的话仍然具有一定风险,所以需要人们在驾驶时时刻保持注意力。

深度 | 车载语音群雄并起共争智能座舱新高地

2022-07-21
阅读 2 分钟
341
不论是苹果公司iOS系统中的智能语言助手“Siri”,还是微软Windows系统中的“Cortana”,智能语音交互早已融入我们生活之中。随着汽车产业的发展,用户消费形态的改变,自动驾驶、智能座舱、新能源这些概念已经逐渐落地成为现实,智能语音交互与汽车之间也擦出了别样的火花。由于驾驶汽车无法解放双手,对于人机互动的需求,...

全速前进! AI助力工业制造智能升级

2022-07-14
阅读 2 分钟
331
实际上,随着数字化进程的加快,智能化才是工业发展的星辰大海,AI与工业的深度交融悄悄成为了业界学界的重要课题,未来很长一段时间内AI将成为工业转型升级的标配。

新型激光辨识算法助力机器人逃离死胡同

2022-07-14
阅读 1 分钟
316
最近北美大学的学生体会到了人工智能带来的生活上的便利,他们足不出户便可以吃到机器人送的餐,虽然这些送餐机器人看似聪明能干,但也存在明显的缺点,它们不太能够辨识方向并及时预测到前方的死胡同和障碍物。

转载 | 全球最大中文单体模型来了!2600亿参数,AI产业规模化应用可期

2022-07-08
阅读 4 分钟
262
上学时候,有的同学花费大量时间去死记硬背,成绩却不一定好。而学霸们往往有这样的心得:在刷题之外还要总结知识体系,事半功倍。人学习过程中的这一现象,在机器学习领域似乎同样得到应验。以巨头们竞争的热点NLP大模型为例,一味增加参数规模就相当于给AI更多的背诵资料。费时费力不说,有些只能从训练数据的海量文本...