WMT15 单句评价任务的分析

2016-09-02
阅读 3 分钟
2.3k
使用的SVM regression, RBF kernel. 用 grid search 设定 hpyer parameter. 使用了17个feature:

Bootstrap的直白说明

2016-08-31
阅读 2 分钟
6.1k
bootstrap不是twitter的那个前端,而是统计学中的概念,下边随实验进行说明假设有个事件,共发生了10000000次,发生的概率呈泊松分布。当然,假设我们是不知道他是泊松分布的

看我打脸Message Pack

2016-08-11
阅读 1 分钟
2.7k
CPython's GC starts when growing allocated object. This means unpacking may cause useless GC. You can use gc.disable() when unpacking large message.

一个数学渣的算法学习笔记

2016-04-25
阅读 1 分钟
2.1k
这里边的都是一些很基础的东西,是本人悉心整理的 一些数学符号 s.t. [链接]s.t.是一个缩写词,一般是指such that,但是在优化的场景中,是指subject to,后边跟限制条件. Such that, describes how something should be done. So that, describes why something should be done. 倒A 表示any,letex的符号为\forall

MacOS入门

2016-04-18
阅读 4 分钟
3.7k
1. 桌面操作 1.1 finder 系统默认的finder太不好用了,使用XtraFinder代替[链接]在10.11中,还需要进行额外的配置[链接] 1.2 截图 截图也不好用,十分诡异的快捷键 Cmd+Shift+3: 全屏截图 Cmd+Shift+4: 选择截图 Cmd+Shift+4, Space: 窗口截图 截图同时按住Ctrl, 保存到剪贴板中 推荐使用QQ的截图键:Ctrl+Cmd+A.如果同...

各种语言处理命令行参数的方法

2016-03-23
阅读 2 分钟
2.2k
Python argparse python2.7/3.2 引入了一个 argparse 的module[链接][链接] {代码...} java Commons CLI {代码...} {代码...}

Linux/MacOS 组件安装速查

2016-03-03
阅读 1 分钟
2k
python-2.7.11 {代码...} python-3.5.1 {代码...} PyQt for python2.7 注意替换下边路径中的用户名 {代码...}

C++ Trie树:cedar

2016-01-27
阅读 9 分钟
12k
Trie树主要分为两类,一类是静态的,一次性构建,构建完成后只读,另一类是动态的,随时可以加入新的key。当然,对于动态构建,其写过程,是不一定保证线程安全的。对于trie的详细分析,见这篇老外的文章:[链接]

各种getline/readline的总结

2016-01-26
阅读 2 分钟
7.1k
关于换行 涉及到的字符有如下两种 {代码...} 不同环境下,默认的换行符(字符序列)不同,需要说明的是,这个序是逻辑序,真实的物理序还要考虑大小端的问题 {代码...} Linux C {代码...} gets在新的标准中已经被弃用了fgets增加了size防止读写过界 这两个函数只识别LF换行符,比较傻瓜。其中gets会去除LF: {代码...} fget...

boost/filesystem 简明说明

2016-01-22
阅读 4 分钟
7.1k
<boost/filesystem/fstream.hpp> 和<fstream>接口类似,不同的是和路径有关的参数从string/const char*变成了path

条件随机场笔记(未完)

2015-12-20
阅读 1 分钟
2.6k
POS(part of speech): 词性对于英文,一般有9大类:noun(名词), verb(动词), article(冠词), adjective(形容词), preposition(介词), pronoun(代词), adverb(副词), conjunction(连词), and interjection(感叹词)。但是实际的语法标注中,词性会分得更细。

英文词干提取(stemming)算法 - Lovins, Porter

2015-10-10
阅读 9 分钟
8.4k
英文词干提取有多种方式,在实践中,可能涉及到机器学习数据挖掘等多方面的内容。这里主要介绍的是易于实现的几种原始算法: Lovins (1968) Porter (1980) Porter2 (2000) 1. Lovins Lovins是最早的实现 1.1. 简介 算法涉及如下部件: ending, 词后缀,共有294个,详细列表见最后 condition, 词后缀去除条件,每个ending...

socket编程与libevent2的一些归纳总结

2015-09-22
阅读 5 分钟
20.2k
对应block,如果一个socket设置为nonblock,那么其相关的操作将变为非阻塞的。这里所说的非阻塞,并不是说异步回调什么的,例如,调用recv()函数: