面部表情识别:让智能AI更聪明
随着人工智能技术的快速发展,面部表情识别技术也得到了广泛的关注。作为一项重要的人机交互技术,面部表情识别已经渗透到了人类生活的各个领域,从游戏、社交、电商到医疗、教育和机器人等领域均得到广泛应用。
2023-04-18
提高图片ocr识别正确率
上一篇文章中用到的方法是从pdf中读取二进制之后,直接生成image,中间调整图片分辨率的参数。这里采用另外一种方法,可以提高图片的清晰度。上代码:
2022-01-26
自学记录鸿蒙API 13:实现多目标识别Object Detection
起步:什么叫多目标识别?无论是生活中的动物识别、智能相册中的场景分类,还是工业领域的检测任务,都能看到多目标识别的身影。这次,我决定通过学习HarmonyOS最新的Object Detection API(API 13),一步步探索如何实现多目标识别应用,并通过亲手完成一个完整的项目来验证自己的学习成果。
2024-12-29
视觉智能开放平台又上线新能力啦,涵盖多个类目!
阿里云视觉智能平台近期针对人脸人体类目上线了五个算法能力,分别是口罩检测、人脸活体检测、表情识别、公众人脸识别以及人体计数,调用起来方便快捷,这里给大家分享下。
2020-03-11
移动端车牌识别技术的应用,为智慧停车、交通管理带来便捷
随着汽车的需求暴增,车辆管理成为了城市管理的重中之重。移动端车牌识别技术已被广泛应用于城市智能交通、智慧小区的系统中,以往是手动录入车牌信息或者是一笔一划抄写车牌信息,如此,会增加人为的误差,降低了工作效率,后来移动端车牌识别技术在车辆管理中被应用,车辆管理体验感得到了提升,如今更是完美的集成了...
2020-07-19
开发与集成:身份证识别 OCR 接口的全面指南
身份证识别OCR(Optical Character Recognition)接口是现代应用程序中越来越重要的一部分,它使得身份证信息的自动化识别和提取变得高效和准确。本文旨在提供关于身份证识别 OCR 接口的全面指南,以便开发者和企业能够更好地利用这一技术。
2023-08-09
OCR识别验证码
最近在爬某网站,老是蹦出来验证码,就想着找个OCR破了这个验证码,然后就开始了OCR探索之旅。 首先简单说一下什么是OCR OCR是(Optical Character Recognition,光学字符识别)的简称,主要用途: 办公用途,用来识别图片里面的文字,可以高效率的录入图片类型文件。 识别网站验证码 详见维基百科或者百度百科 OCR识别...
Tongue Twister-快速集成华为实时语音识别服务玩转绕口令
实不相瞒,小编作为了一个湖南人,时常被说普通话不够标准,不仅N/L不分,有时候还分不出来卷舌音,经常闹笑话,导致小编十分苦恼。 有时看着电视里的主持人流利的口播,和完全标准的绕口令都羡慕不已,常常幻想着自己有一天也能说一口流利的绕口令。恰巧,小编昨日上网的时候被推送了集成了华为HMS ML Kit实时语音服务...
2020-11-28
人脸识别技术演进:从几何算法到深度学习的深度剖析
本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标,深入分析了从几何特征到深度学习的技术演进。关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发...
2023-12-27
问:鸿蒙 App 中无法使用图像识别功能,该如何解决?
应用无法使用设备的图像识别功能
问:h5做的聊天页面,内嵌到手机app中,如何识别系统最近的一次截图?
h5可以识别系统最近的截图吗?
2020-12-10
问:鸿蒙 App 开发过程中,无法使用指纹识别该如何处理?
应用无法使用设备的指纹识别功能
问:HarmonyOS 是否提供指纹、人脸识别能力?
如题:HarmonyOS 是否提供指纹、人脸识别能力?
2024-12-17
问:windows 下 python2的如何在一个string中识别不能打印的uincode字符,打印其他可正常打印的字符?
如题,windows 下 python2 的uincode 总是有打不出的字符,如何在一个string中识别这个字符,然后这个字符还是uincode方式输出,其他字符正常打印呢?
2016-11-11
问:请问js是否可以直接识别psd文件中的图层选区和特效?
各位大神,目前leader有个需求:就是用户上传logo图片后可以自动贴合我们所有的模板,我们的模板都是psd格式。所以需要前端可以识别出替换图层的选区,这样logo可以自动去适应大小、形状及位置;另外还需要识别出psd文件里光照等特效,自动适应到替换logo后的效果图上。请各位提供下思路,谢谢!我调研了psd.js。貌似psd...
2021-06-28✓ 已解决
问:有什么开源免费的 ocr 可以识别下面的图片中的文字:「禁闭岛」?
有什么开源免费的 ocr 可以识别下面的图片中的文字:「禁闭岛」测试了一下最热门的 pytesseract 发现根本无法识别图中的任何文字,报错英文和中文 {代码...} 最好还能识别这种竖着的文字:需要可以封装成 http api 服务,所以那种本地小工具不行
2024-02-28✓ 已解决
DCASE 2020权威声学比赛:腾讯多媒体实验室斩获双项指标国内第一
近日,在第六届国际权威声学场景和事件检测及分类竞赛 (Detection and Classification of Acoustic Scenes and Events, DCASE 2020) 中,腾讯多媒体实验室天籁音频研究团队首次参加了声学场景识别 (Acoustic Scene Classification, Task 1) 任务竞赛,并从47支来自全球顶尖学术界和工业界的声学研究队伍中脱颖而出,取得...
2020-07-04