三点几嚟,饮茶先啦!PaddleSpeech发布全流程粤语语音合成

2023-04-03
阅读 5 分钟
1.1k
PaddleSpeech 是飞桨开源语音模型库,其提供了一套完整的语音识别、语音合成、声音分类和说话人识别等多个任务的解决方案。近日,PaddleSpeech 迎来了重要更新——r1.4.0版本。在这个版本中,PaddleSpeech 带来了中文 wav2vec2.0 fine-tune 流程、升级的中英文语音识别以及全流程粤语语音合成等重要更新。接下来,我们将详...

拯救脂肪肝第一步!以飞桨3D医疗影像分割方案MedicalSeg自主诊断脂肪肝

2023-03-31
阅读 7 分钟
1k
现在人们的日常生活方式和饮食结构发生了巨大的变化,大概就是吃好了,动少了。体内的过量的甘油三酯无法代谢,最终聚集在肝细胞内,导致人体中正常肝脏逐步变成脂肪肝。长期患有脂肪肝可能会导致肝硬化,并最终增加患慢性肝病的风险。医学影像学领域可以通过CT或者B超技术来判断患者是否患有脂肪肝,其中CT的脂肪肝检出...

无人机巡检场景小目标检测与量化加速部署方案详解

2023-03-30
阅读 4 分钟
927
在社会活动和社会生产中,巡检是一个必不可少的环节。然而,传统的人工巡检方式存在效率低下、成本高昂、安全风险大等问题,限制了巡检的效果和范围。无人机巡检因其高效、灵活、安全的特点被越来越多的企业采用。但是,如何在无人机巡检中快速准确地检测出小目标,成为了该技术的重要难点之一。本文将介绍一种基于 PP-Y...
封面图

CVPR 2023 大模型研讨会召开在即,国际技术竞赛正式开赛

2023-03-29
阅读 4 分钟
797
CVPR作为计算机视觉和模式识别领域的世界级学术顶会,不仅是学者们展示前沿科技成果的学术会议,也是企业界探索前沿应用的一大平台。近年来,随着大模型技术的爆发式发展,基于大模型技术的创新应用正逐步在产业界释放出巨大价值空间。

飞桨DeepXDE用例验证及评估

2023-03-28
阅读 13 分钟
884
在之前发布的文章中,我们介绍了飞桨全量支持业内优秀科学计算深度学习工具 DeepXDE。本期主要介绍基于飞桨动态图模式对 DeepXDE 中 PINN 方法用例实现、验证及评估的具体流程,同时提供典型环节的代码,旨在帮助大家更加高效地基于飞桨框架进行科学计算用例建设与调试。

中康数字科技:基于大模型的医学文本信息处理与抽取

2023-03-28
阅读 2 分钟
613
在医疗行为开展的过程中,存在辨明药品禁忌症、了解不良反应、明确配伍禁忌和调整用药方式等实际需求,市面现有产品的功能较为单一、应用范围窄、数据更新慢无法满足业务需求,例如:药店场景SKU管理(Stock Keeping Unit,库存保有单位)要求数据标准化且更新频率高;在处方流转中,医院、药房、药店有审方需求。广州中...

山东大学-飞桨人工智能教育创新中心正式挂牌,打造区域产教融合新范式

2023-03-27
阅读 2 分钟
405
当前,生成式AI热潮推动,人工智能正驶入发展快车道,复合型AI人才需求攀升,产教融合持续深化。3月25日,在泉城济南,百度飞桨协同山东大学、济南大学、青岛理工大学,共同举办飞桨院长高峰论坛暨“中国软件杯”大学生软件设计大赛百度赛项东部赛区启动会。活动现场,山东大学-飞桨人工智能教育创新中心正式挂牌成立。

中康科技黄毅宁:AI+医疗,于我而言是圆梦

2023-03-27
阅读 2 分钟
439
医疗行业,与我们的生命健康息息相关。如何将 AI 技术应用到医疗行业,更好地服务医疗科研人员提高科研工作效率,帮助更多患者享受到先进的医疗服务,是广州中康数字科技有限公司一直以来的发展目标。基于此,中康科技借助百度飞桨深度学习、文心大模型等人工智能技术,结合自研的数据采集网络、大数据处理技术与生态化...

ADDS-DepthNet:基于域分离的全天图像自监督单目深度估计

2023-03-27
阅读 5 分钟
477
无人驾驶车辆在路上行驶时,通常需要配置激光雷达获得高精度点云数据,从点云数据中获取主车与周围各个障碍物的距离。但是,激光雷达的成本高,因此,很多学者尝试用相机来估计主车与周围各个障碍物的距离,从而尽可能地降低成本。

主题及关卡揭晓!全国智能汽车竞赛智慧交通创意组发布倒计时

2023-03-23
阅读 2 分钟
475
「全国大学生智能汽车竞赛」是教育部倡导的大学生科技A类竞赛,是2022年全国普通高校大学生竞赛榜单内竞赛,中国高等教育学会将其列为含金量最高的大学生竞赛之一。 在全国数百所高校的支持下,全国大学生智能汽车竞赛至今已成功举办了十七届,是极受欢迎的国家级创意性科技竞赛。

金融监管科技业务中的AI应用:上市公司公告信息风险识别

2023-03-23
阅读 3 分钟
588
面对日益严格的监管,证券公司自身需要提高融资融券业务的风险管控能力,从而扩大业务规模、降低风险。因此,证券公司需要了解可能影响证券价格较大变化的重要事件,从而进行管理和风险控制等工作。根据监管要求,企业定期或不定期地发布公告信息。作为公司信息披露的主要载体,公告信息可能包含事件描述、深度分析、信...

基于文心一言的底层视觉理解,百度网盘把「猫」换成了「黄色的猫」

2023-03-22
阅读 5 分钟
1.1k
随着移动互联网的一路狂飙,手机已经成为人们的新器官。出门不带钥匙可以,不带手机却是万万不可以的。而手机上,小小的摄像头也越来越成为各位「vlogger」的口袋魔方。每天有超过数亿的照片和视频被上传到百度网盘中,这些照片和视频大多来自于用户自己的拍摄或收藏,覆盖的主题和内容相当广泛,包括人物、风景、动物、...

“中国软件杯”重磅预告!首批百度赛题即将发布

2023-03-22
阅读 2 分钟
849
“中国软件杯”大学生软件设计大赛是由国家工业和信息化部、教育部、江苏省人民政府共同主办,是全国软件行业规格最高、最具影响力的国家级一类赛事,为《全国普通高校竞赛排行榜》榜单内赛事。今年,组委会联合百度飞桨共同设立了“智能系统设计与开源创新专项赛道”,下设若干赛道,全面覆盖高职、本科及以上学生。赛道均...

文档智能分析产业实践,基于PP-StructureV2和OpenVINO实现训练部署开发全流程

2023-03-22
阅读 2 分钟
784
金融和医疗等行业存在大量书面文档结构化分析和内容提取场景和任务,例如合同、票据、卡证识别、纸质文本等电子化存储、文件复原与二次编辑、信息检索等。由于布局和格式的多样性和复杂性、低质量的扫描文档图像,自动、精准、快速的信息处理和提取对企业来说是一项具有挑战性的任务。 文档智能是指通过计算机进行自动阅...

沐曦与百度飞桨完成兼容性测试,助力计算机视觉应用发展

2023-03-21
阅读 1 分钟
831
近日,沐曦集成电路(上海)有限公司(以下简称“沐曦”)的曦思®N100人工智能推理GPU与百度飞桨完成 I 级兼容性测试。测试结果显示,双方兼容性表现良好,整体运行稳定。这是沐曦自2022年9月加入“硬件生态共创计划”后的阶段性成果。

百度CTO王海峰:全栈AI技术加持,打造新一代大语言模型文心一言

2023-03-21
阅读 2 分钟
807
3月16日,百度在北京总部召开新闻发布会,百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰出席,李彦宏展示了新一代知识增强大语言模型文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五个使用场景中的综合能力,王海峰解读了文心一言的技术特性及其背后的技术积累。

基于飞桨实现的特定领域知识图谱融合方案:ERNIE-Gram文本匹配算法

2023-03-20
阅读 8 分钟
703
文本匹配任务在自然语言处理领域中是非常重要的基础任务,一般用于研究两段文本之间的关系。文本匹配任务存在很多应用场景,如信息检索、问答系统、智能对话、文本鉴别、智能推荐、文本数据去重、文本相似度计算、自然语言推理、问答系统、信息检索等,这些自然语言处理任务在很大程度上都可以抽象成文本匹配问题,比如...

文心一言:这48小时,我被问了xxxx个问题

2023-03-19
阅读 2 分钟
1.2k
16日下午14:00文心一言开启邀测了!作为国内首个新一代知识增强大语言模型、生成式 AI 产品,“邀测通道”瞬间被挤爆,甚至连百度人自己也需要排队等候。 但随着厂长的一声令下,开放了百度内部全员申请 

百度生成式AI产品文心一言邀请测试,五大场景、五大能力革新生产力工具

2023-03-16
阅读 4 分钟
806
3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏及百度首席技术官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

【科学计算】使用飞桨高阶自动微分功能探索AI+结构领域科研

2023-03-15
阅读 8 分钟
741
在工程和科学领域,AI与科学方法的结合正在解决更多经典科学问题,并在固体、流体、传热、材料等越来越多的领域得到了验证。为了更好支撑科研人员开展AI与基础学科的交叉融合研究,百度飞桨不断完善框架能力,提供支持AI+科学计算的复数算子、高阶自动微分机制以及高性能编译等等。

【硬件生态】飞桨携手登临解读软硬一体技术优势,共推AI产业应用落地

2023-03-15
阅读 1 分钟
456
众所周知,AI应用落地面临着场景碎片化、开发成本高、算力成本高等诸多难题,这对AI框架与AI芯片都提出了非常高的要求,即既要满足端、边、云多场景的部署需求,还需要支持自动化压缩与高性能推理引擎深度联动。因此充分发挥软硬一体融合优势,才能为AI产业应用落地提供最优解。

【开发者说】“一键飞桨”,轻松实现飞桨框架和套件的下载安装!

2023-03-13
阅读 6 分钟
643
大家好,我是散步,很荣幸能和大家分享一个搭建飞桨全系列产品开发和使用环境的小工具。希望它能够帮助你在新场景下快速搭建飞桨工作台,让大家能够更简单地将飞桨安利给身边的朋友。

【伙伴赋能】南洋万邦加入飞桨技术伙伴计划,共同助力企业数智化转型

2023-03-10
阅读 1 分钟
579
近日,上海南洋万邦软件技术有限公司正式加入飞桨技术伙伴计划,双方将共同努力在自然语言识别、计算机视觉、趋势分析等领域中,共建AI能力,帮助客户完成企业数智化转型。    

【技术干货】PaddleDetection v2.6发布:目标小?数据缺?标注累?泛化差?PP新员逐一应对!

2023-03-10
阅读 8 分钟
1k
从2022年10月份开始,大家已经陆续在PaddleDetection仓库的develop分支下尝鲜体验了一些预发布的新算法。如今经过4个月的打磨升级,PaddleDetection v2.6正式发布,最新版本有哪些更新以及性能提升呢?快来打开这份更新解读吧!

没有钢琴也可实现弹奏自由?实时在Jetson上运行单阶段手指关键点模型

2023-03-07
阅读 8 分钟
623
钢琴是人类创作音乐的经典乐器,程序是实现创意的工具之魂。今天我给大家分享用程序实现的桌上钢琴师项目。本项目基于飞桨实现一个虚拟钢琴,让大家可以在任意平面上弹奏钢琴,实现弹奏自由。

动转静两大升级!一键转静成功率领先,重点模型训练提速18%+

2023-03-07
阅读 5 分钟
793
目前主流深度学习框架支持的编程方式有两种,分别为动态图和静态图。动态图的Pythonic编程体验更佳、更易调试,但性能方面与静态图有一定差距。静态图先组网再执行,预先拥有完整网络结构,更利于全局优化,虽调试难度大,但执行性能更佳。

嘉楠科技加入硬件生态共创计划,共同打造一站式AI解决方案

2023-03-06
阅读 2 分钟
747
近日,嘉楠科技与百度飞桨签署硬件生态共创计划合作协议,正式加入由飞桨发起的硬件生态共创计划。当前双方的合作主要基于嘉楠科技勘智系列AI芯片产品。

自制有声书阅读器:用PaddleSpeech打开读书新方式

2023-03-06
阅读 10 分钟
672
随着互联网的发展,普通用户对于书籍展示形式的需求已由纯文字变成了图文、语音、视频等多种形式,因此将文本书籍转换为有声读物具有很大的市场需求。本文以飞桨语音模型库PaddleSpeech提供的语音合成技术为核心,通过音色克隆、语速设置、音量调整等附加功能,展示有声书籍的技术可行方案。最终呈现效果如player.bilibi...

一文读懂PaddleSpeech中英混合语音识别技术

2023-03-02
阅读 4 分钟
1.2k
语音识别技术能够让计算机理解人类的语音,从而支持多种语音交互的场景,如手机应用、人车协同、机器人对话、语音转写等。然而,在这些场景中,语音识别的输入并不总是单一的语言,有时会出现多语言混合的情况。例如,在中文场景中,我们经常会使用一些英文专业术语来表达意思,如“GPS信号弱”、“Java工程师”等,这就给语...

GTC23 看点预告 | 从深度学习框架到开发工具,百度飞桨携最新成绩单亮相 GTC

2023-03-01
阅读 3 分钟
650
NVIDIA GTC 将于 2023 年 3 月 20 日-23 日在线上举行,包括超过 650 场演讲、专家座谈会以及特别活动,涵盖加速计算和开发工具、计算机视觉、对话式 AI/NLP、数据科学、深度学习、数字孪生和世界仿真、图形和 XR、高性能计算、推荐系统/个性化等多个主题。全球范围的技术专家、开发者、研究人员、创作者、IT 决策者和企...
封面图