SnowNLP:一个处理中文文本的 Python 类库
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,...
NLP入门(七)中文预处理之繁简体转换及获取拼音
在日常的中文NLP中,经常会涉及到中文的繁简体转换以及拼音的标注等问题,本文将介绍这两个方面的实现。 首先是中文的繁简体转换,不需要使用额外的Python模块,至需要以下两个Python代码文件即可:
使用 Google Play Points 提升付费留存及用户粘性 | Android 开发者故事
Google Play Points 是一项鼓励用户参与 Play 生态系统的奖励计划。特定的开发者将受邀提供对特定应用的 Play Points 促销活动,通过提供更丰厚的奖赏,提升应用的用户留存率和积分重投率。
2021-08-18
基于python的百度云网盘资源搜索引擎设计架构
大家都知道百度云网盘上有很多分享的资源,包括软件、各类视频自学教程、电子书、甚至各种电影、BT种子应有尽有,但百度云却没有提供相应的搜索功能。个人平时要找一些软件、美剧觉得非常蛋疼。于是就尝试开发一个百度云资源的搜索系统。
在Google Cloud Platform申请云计算引擎
Google Cloud Platform的新用户可以获得$300赠金的一年使用权,使用这笔不菲的赠金,我们可以构建应用程序、搭建网站、存储数据、体验各种强大的API。这次,我总结了使用Google云平台申请计算引擎的过程。
前端工程代码规范(二)——HTML
总原则 缩进使用soft tab(4个空格); 属性名全小写,用中划线做分隔符; 在属性上,使用双引号,而非单引号; 不要在自动闭合标签结尾处使用斜线。 {代码...} HTML5 doctype 在页面顶部,用doctype来启用标准模式,使得每个浏览器的展现都尽可能地保持一致。虽然doctype不区分大小写,但是按照惯例,doctype大写,写法...
文字识别丨身份证OCR识别技术-云识客人脸识别
身份证是是确认公民权益、证明公民身份的证件,我们会在许多地方用到它,但是每个输入或者填写身份证号码,实在是麻烦至极,那么,身份证ocr的出现就很好的解决了这个问题,只要一扫描所有信息全部识别为文字,大大的节约了我们的时间。
2019-08-20
如何查看 Linux 默认时区
最近遇到一个跟服务器时区相关的问题,没准备充分,当问题真正来临时,有点懵。特别是在生产环境中,系统时区是特别重要的存在,很多应用在默认情况下,都是取的系统时区,如果时区处理不得当的话,可能会造成不必要的困扰。时区的概念关于时区,有以下几个标准:CST:中国标准时间(China Standard Time)UTC:协调世界...
应用移动端身份证识别技术,实现APP扫描绑定身份证号
近些年,大众的创新创业非常高,出现了大量的APP,在APP中,用户信息注册是必不可少的环节,尤其是大型公众平台、第三方支付平台、二手车交易平台等,更是有庞大的用户群体来进行信息输入。在这样的大环境中,谁能提供更好的用户体验,谁就会在竞争中抢得先机。出于对业务模式创新,以及用户体验优化的追求,以前很多依...
2021-03-09
直播点播影院系统的怎么选
随着国内外电影的大卖,票房的收入不断增加,电影可谓是大众一项娱乐的方式,私人影院也就随之发展起来。私人影院的发展给人们带来了新的生活娱乐体验,两三个好友一个包厢,喝着饮料吃着爆米花,可以一起聊着剧情,不必像传统影院需要注意的地方那么多。那么在这些地方可以满足观看者的需求外,还有最重要的一点就是观...
2021-10-20
常用正则表达式汇总
汇总了常用的正则,定期更新。URL匹配匹配http或https开头得url,兼容端口号,来自与Yii2框架:validators/UrlValidator.php {代码...} QQ号码5到11位数字,不能以0开头,其中11位的是手机号码,手机号码也可以当作QQ号码登录 {代码...} IP地址来自于Yii2框架:validators/IpValidator.phpIPV4 {代码...} IPV6 {代码...}...
宁德时代痛失荣誉董事长!二次创业关键先生张毓捷去世,享年79岁
在宁德时代近期经历各种传闻和股价市值波动中,一则讣告被官宣,称宁德时代荣誉董事长张毓捷博士因病医治无效,于2022年2月14日逝世,享年79岁。
2022-02-15
【FAQ】HarmonyOS SDK 闭源开放能力 —Map Kit(3)
compatibleSdkVersion升级到5.0.0(12)之后,调用坐标系转换API:map.convertCoordinate(mapCommon.CoordinateType.WGS84, mapCommon.CoordinateType.GCJ02, { longitude: location.longitude, latitude: location.latitude })会必现启动native crash。例如,创建一个空白工程(empty ability),在EntryAbility....
2024-10-21
如何用AI实现视频防抖?还是无需裁剪画面的那种 | 谷歌&台湾大学
右边的画面,是不是比左边的画面看上去稳定许多?这样的效果,大家可能并不陌生。现在,不少手机厂商都为自家手机配备了类似的防抖算法,为你拍摄生活Vlog提供便利。不过,目前的智能手机在面对复杂的抖动时,主要是通过电子防抖(EIS)的方式来实现画面的稳定。也就是说,需要对画面的边界进行裁剪,通过“后期处理”,实...
2021-02-13
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
阿里云AI搜索产品荣获Elastic Innovation Award 2024,该奖项于近日在新加坡ElasticON 2025的Elastic合作伙伴峰会上颁发,旨在表彰基于Elastic平台开发企业级生成式人工智能(GenAI)应用的顶尖合作伙伴,这些应用有效帮助客户优化搜索、安全和可观测性领域的工作流程。
2025-03-19
智能搜索引擎 | 驱动电商业务增长实践
开放搜索是阿里集团搜索业务中台,基于大数据深度学习在线服务体系打造的智能搜索云服务产品。拥有核心引擎、召回排序、搜索引导、充分开放等核心能力,可应用在电商行业、教育行业、内容行业等场景。目前帮助数千家客户搭建自己的搜索业务。实践案例:[链接]
2022-09-21
Hexo进阶高级教程(二)
接上一篇Hexo进阶高级教程(一)继续探讨Hexo,主要的功能都有了,要想让整个博客更丰富,访问速度更快更流畅,就需要添加一些附加的功能,做一些优化处理。下面会讲解: