多语种平行语料数据,助力“一带一路”深入交流

2023-02-24
阅读 1 分钟
456
截至2021年1月底,中国已同140个国家和31个国际组织签署了205份共建“一带一路”合作文件,其中涉及12语系、28语族,约132种语言。语言多样性所引发的语言障碍被认为是阻碍“一带一路”相关国家、地区深入交流的主要挑战之一。随着近年人工智能和自然语言处理技术的快速发展,机器翻译技术与人工翻译水平的差距不断拉近,机...

多语种平行语料数据,助力“一带一路”深入交流

2023-02-17
阅读 1 分钟
270
截至2021年1月底,中国已同140个国家和31个国际组织签署了205份共建“一带一路”合作文件,其中涉及12语系、28语族,约132种语言。语言多样性所引发的语言障碍被认为是阻碍“一带一路”相关国家、地区深入交流的主要挑战之一。随着近年人工智能和自然语言处理技术的快速发展,机器翻译技术与人工翻译水平的差距不断拉近,机...

INTERSPEECH 2022 | 价值30万自然对话语音数据免费送

2022-09-16
阅读 1 分钟
349
由国际语音通信协会ISCA组织,全球最大的综合性语音信号处理领域的科技盛会之一INTERSPEECH,将于2022年9月18日-22日在韩国仁川迎来第23届以“Human and Humanizing Speech Technology”为主题的会议。

数据推荐 | 自然场景OCR文字识别数据集一览

2022-09-09
阅读 3 分钟
478
自然场景OCR任务介绍文字识别(optical character recognition,OCR)是指例如扫描仪或数码相机的电子设备检查图像中的字符,然后用字符识别方法将形状翻译成计算机文字的任务。OCR应用场景比较丰富,包括自然场景、手写场景、文档识别等。作为OCR任务中应用最广泛、具备巨大市场需求的场景之一是自然场景OCR。自然场景...

智能座舱行为识别数据解决方案,助力打造第三空间新体验

2022-09-02
阅读 3 分钟
455
智能座舱关注车内感知,通过在车内安装摄像头感知驾驶员和乘客的行为以及车内状况。座舱行为识别任务旨在识别车辆座舱中驾驶员及乘客的行为,改善驾乘体验提供技术支持,以提供驾驶员和乘客更好的驾乘体验和更安全的行车保障。

融合与创新:数据堂骨龄标注工具为医生赋能

2022-09-02
阅读 2 分钟
434
骨龄是评价青少年儿童生物年龄的主要方法,骨龄与实际年龄并不是必须一致的,骨龄检查可以了解骨骼的发育情况,判断骨龄发育迟缓还是过速,了解身材过矮的原因以及预后。在临床医学、法医学和运动医学等领域中有广泛的用途。

CVPR 2022 | 数据堂亮相计算机视觉领域盛会

2022-08-26
阅读 1 分钟
346
一年一度全球顶级的计算机视觉领域盛会 IEEE / CVF Computer Vision and Pattern Recognition Conference(以下简称“CVPR”)于6月19日在美国路易斯安那州新奥尔良拉开帷幕。作为计算机视觉领域的顶级会议,CVPR每年都会吸引大量来自全球人工智能、计算机视觉以及机器学习领域的专业人士。

通用场景语音合成数据集推荐

2022-08-26
阅读 2 分钟
441
语音合成,通常又称文语转换(Text To Speech,TTS),是一种可以将任意输入文本转换成相应语音的技术,是人机语音交互中不可或缺的模块之一。传统语音合成传统的语音合成系统通常包含前端和后端两个模块。前端模块主要是对输入文本进行分析,提取后端模块所需要的语言学信息。对中文合成系统来说,前端模块一般包含文本...

转载 | 自动驾驶开源数据集总结

2022-08-19
阅读 11 分钟
676
前言数据是人工智能时代的石油,随着汽车行业的发展、自动驾驶商业场景的落地,自动驾驶算法变得尤为重要,想要打磨自动驾驶算法,就需要大量的场景数据支撑。作者对过去使用、积累的自动驾驶开源数据集做了总结,以下45个自动驾驶开源数据集供大家参考。​4Seasons题目:4Seasons: A Cross-Season Dataset for Multi-Wea...

活体检测再升级,3D头模数据增强“刷脸”保护罩

2022-08-19
阅读 2 分钟
243
如今,人脸识别技术在各行各业中的应用越来越广泛。随着人脸识别系统给人们日常生活带来便利的同时,也面临着各类人脸欺诈攻击,随之而来的技术安全性也愈发受到重视。如何区分真实人脸与虚假人脸,对于人脸识别系统的安全具有十分重要的意义。​常见的人脸欺诈攻击行为常见的人脸欺诈攻击方式包括打印人脸照片、屏幕播放...

数据集 | 语音合成音库助力机器人客服“声入人心 ”

2022-08-09
阅读 2 分钟
401
“尊敬的用户您好,如需办理业务请按1,办理业务请按2...或者您可通过自助语音或关注某某公众号等自助渠道办理相关业务...”联系过客服的人,这句话一定不陌生。早期智能客服使用的语音合成技术属于播音式风格,音质“机械感”浓重,音色损失大、刻板、语速不够流畅自然,无法做到高度拟人化,用户听多了容易产生听觉疲劳。...

万字长文!DeepMind科学家总结2021年的15个高能研究

2022-08-03
阅读 6 分钟
395
2021年借助更强大的算力、数据和模型,ML和NLP依然发展迅速,DeepMind科学家最近总结了过去一年的十五项亮点研究方向,快来看看哪个方向适合做你的新坑!  最近,DeepMind科学家Sebastian Ruder总结了15个过去一年里高能、有启发性的研究领域,主要包括: Universal Models 通用模型Massive Multi-task Learning 大规模...

谷歌公开自动驾驶新专利:通过眼睛注视向量,精确判断注意力

2022-07-21
阅读 1 分钟
344
当前,我们正处在智能驾驶技术迅速发展的时代,具有智能驾驶、辅助驾驶功能的车辆正变得越来越普遍。但是,当前智能驾驶技术尚不完善,一些功能如果完全智能驾驶的话仍然具有一定风险,所以需要人们在驾驶时时刻保持注意力。

深度 | 车载语音群雄并起共争智能座舱新高地

2022-07-21
阅读 2 分钟
341
不论是苹果公司iOS系统中的智能语言助手“Siri”,还是微软Windows系统中的“Cortana”,智能语音交互早已融入我们生活之中。随着汽车产业的发展,用户消费形态的改变,自动驾驶、智能座舱、新能源这些概念已经逐渐落地成为现实,智能语音交互与汽车之间也擦出了别样的火花。由于驾驶汽车无法解放双手,对于人机互动的需求,...

全速前进! AI助力工业制造智能升级

2022-07-14
阅读 2 分钟
332
实际上,随着数字化进程的加快,智能化才是工业发展的星辰大海,AI与工业的深度交融悄悄成为了业界学界的重要课题,未来很长一段时间内AI将成为工业转型升级的标配。

新型激光辨识算法助力机器人逃离死胡同

2022-07-14
阅读 1 分钟
317
最近北美大学的学生体会到了人工智能带来的生活上的便利,他们足不出户便可以吃到机器人送的餐,虽然这些送餐机器人看似聪明能干,但也存在明显的缺点,它们不太能够辨识方向并及时预测到前方的死胡同和障碍物。

转载 | 全球最大中文单体模型来了!2600亿参数,AI产业规模化应用可期

2022-07-08
阅读 4 分钟
262
上学时候,有的同学花费大量时间去死记硬背,成绩却不一定好。而学霸们往往有这样的心得:在刷题之外还要总结知识体系,事半功倍。人学习过程中的这一现象,在机器学习领域似乎同样得到应验。以巨头们竞争的热点NLP大模型为例,一味增加参数规模就相当于给AI更多的背诵资料。费时费力不说,有些只能从训练数据的海量文本...

【好数推荐】小语种语音数据集

2022-07-08
阅读 1 分钟
295
近两年,随着“一带一路”建设的深入推进以及AI和云计算等新兴技术产业迅速崛起,已经有越来越多的中国科技企业实现走出去。然而,对于一些人工智能企业来说,出海之路仍面临诸多难题。首当其冲就是语言问题,准确而清晰的识别语音,是智能产品打开当地市场的基本前提。

转载 | 自动驾驶数据服务市场占有率居首,这家公司是如何做到的?

2022-06-29
阅读 3 分钟
259
从今年上海车展中搭载激光雷达的新车“含量”可以看到,各大车企正在加速跑步入场高级别辅助驾驶时代。“乘用车是继商用车之后主要的准自动驾驶应用场景和阵地,其规模将远大于商用车的落地。预计2030年,高级别辅助驾驶将成为乘用车的常规标配。”一位业内人士表示。而在如此迅猛的普及趋势下,大众仍然无法免除对于智能驾...

冬奥AI手语主播亮相,人工智能技术助力跨越声音障碍

2022-06-29
阅读 2 分钟
285
万众期盼的2022年北京冬奥会即将举行,这是中国历史上第一次举办冬季奥运会。在关注冬奥会的观众中,有一个特殊的群体,他们听不到赛场的声音,但他们关注着冬奥赛事,希望了解比赛动态,渴望感受比赛的激情,全球约4.3亿人有中度及以上程度的听力障碍,根据全国第二次残疾人抽样调查数据,中国有听障人士2780万。

数据堂出席Scale.up 360 Sensor & Radar Systems Europe 2021线上展会

2022-06-22
阅读 1 分钟
321
一年一度的全球顶级多传感器融合领域盛会Scale.up 360 Sensor & Radar Systems Europe 2021线上展会于11月17日拉开帷幕,本届展会重点聚焦多传感器融合领域的最新研究进展和技术,超过150余家主机厂商、人工智能、传感器和成像视觉系统领域的专家线上参与了本次会议。

【好数推荐】方言语音数据集

2022-06-22
阅读 2 分钟
290
中国的方言南北差异太大,哪怕同属于一个大的方言分区,也分歧异出,方言数据的采集,面临很多困难。一般来说,数据集的采集无非是字、词、句的搜罗,把该方言常用句子、词语通过文字、音标乃至语音的方式记录下来,集成一个数据库,供人工智能学习使用。但众多方言种类意味着需要收集的数据也是海量的,很难在短时间建...

转载 | 自动驾驶中的9种传感器融合算法

2022-06-15
阅读 2 分钟
353
让我们通过一个例子来更好地理解什么是传感器融合,以利用激光雷达和摄像头进行行人检测为例,如果两个传感器中的一个没有检测到行人,另一个传感器就能作为冗余来增加检测到行人的机会,如果两个传感器都检测到了行人,传感器融合技术则能使我们更准确地知道行人位置。

一张照片就能攻破人脸识别系统,人脸识别安全性亟需提高

2022-06-15
阅读 1 分钟
2.5k
如今,看一眼手机,就能唤醒屏幕进行刷脸解锁。逛完超市,双手提着购物袋,看一眼收银台的终端设备,就能刷脸支付。如此便利的体验,都缘于人脸识别技术的普及。

【好数推荐】数据堂平均音色语音库

2022-06-07
阅读 1 分钟
347
语音合成,即是把文字变成声音的技术,声音是文字内容的信息载体。语音交互是日常生活中最常见、最被人熟悉并乐于接受的展现形式,语音交互体验效果的好坏,会对用户的感知造成很大影响。如果语音合成质量较好,说话效果更接近真人且情感表达丰富,那么用户的交互意愿自然也会更强,用户会觉得这不是一个冷冰冰的机器,...

澳大利亚研究人员开发出新技术,可提高智能驾驶安全性

2022-06-07
阅读 1 分钟
396
这项技术使用了用于智能交通系统(ITS)的新兴技术,又称”合作“或”集体感知“(CP)技术。该技术通过配备摄像头和激光雷达等附加传感器的路边ITS信息共享单元(ITS站)收集并共享信息,智能驾驶汽车通过这个系统可以用更多的视角进行环境观察,能增加其感知范围,看到更多之前看不到的信息。澳大利亚机器人中心的Eduardo ...

【好数推荐】面向儿童的语音数据集

2022-06-01
阅读 1 分钟
389
工程师在对语音识别做研究的过程中发现现有的人工智能并不能很好的识别儿童语音,包括在Amazon Echo与Google Home等设备在与儿童交互的场景下的都出现了识别错误的现象。

冬奥会迎来黑科技,智能机器人上岗防疫

2022-06-01
阅读 2 分钟
402
2022年北京冬奥会倒计时100天之际,来到“冰立方”进行采访报道的媒体都会被眼前不断穿梭的智能机器人所吸引,它们有着不同的造型,更有着出众的“工作”能力,这里面既有清扫机器人、消毒机器人也有5G送餐机器人,可以说它们的出现不仅为日常的工作提供便利,同时也成为一道亮丽的风景线。

【好数推荐】高质量的语音合成数据集

2022-05-18
阅读 1 分钟
531
语音合成技术是将任意文本转换成语音的技术,是人与计算机语音交互必不可少的模块。如果说语音识别技术是让计算机学会“听”人的话,那么语音合成技术就是让计算机程序把文字“说”出来。

【好数推荐】自然对话语音数据集来啦!

2022-05-12
阅读 1 分钟
483
当前行业提供的大部分人工智能数据都以朗读式训练数据为主,然而人与机器之间的交互不应该只是一问一答的简单对话或者命令控制,而是要理解语言的上下文,识别人的情感需求并做出相应的反馈”。