11

2016-02-06
阅读 1 分钟
1.4k
$a_1$

jieba分词学习笔记(三)

2015-12-02
阅读 2 分钟
11.2k
有向无环图,directed acyclic graphs,简称DAG,是一种图的数据结构,其实很naive,就是没有环的有向图_(:з」∠)_

jieba分词学习笔记(二)

2015-11-29
阅读 4 分钟
14.4k
<!-- toc --> 分词模式 jieba分词有多种模式可供选择。可选的模式包括: 全切分模式 精确模式 搜索引擎模式 同时也提供了HMM模型的开关。 其中全切分模式就是输出一个字串的所有分词, 精确模式是对句子的一个概率最佳分词, 而搜索引擎模式提供了精确模式的再分词,将长词再次拆分为短词。 效果大抵如下: {代码....

jieba分词学习笔记(一)

2015-11-28
阅读 5 分钟
45k
中科院的ICTCLAS,哈工大的ltp,东北大学的NIU Parser是学术界著名的分词器,我曾浅显读过一些ICTCLAS的代码,然而并不那么好读。jieba分词是python写成的一个算是工业界的分词开源库,其github地址为:[链接]

Py tricks(1): python实现不可修改的常量

2015-11-28
阅读 2 分钟
10.7k
因为种种原因,Python并未提供如C/C++/Java一样的const修饰符,换言之,python中没有常量,至少截止2015年年末,还没有这个打算。Python程序一般通过约定俗成的变量名全大写的形式来表示这是一个常量,但是这终究不是长久之计。