隐马尔科夫模型

2022-03-11
阅读 8 分钟
1.4k
隐马尔科夫模型(Hidden Markov model),HMM是很流行的序列模型,广泛应用在语音识别等领域,也可以用在词性标注、实体识别等文本问题中。

文本表示

2022-03-05
阅读 3 分钟
852
对于自然语言处理各类应用,最基础的任务是文本表示。文本是不能直接作为模型的输入的,都是要转化成向量的形式再导入到模型中训练。所谓文本的表示就是研究如何将文本表示成向量或者矩阵的形式。文本表示的最小单元是单词,其次是短语、句子、段落。我们需要懂得把这些都表示成向量的形式,其中,单词的表示法是最基础...

词向量技术

2022-03-04
阅读 4 分钟
1.9k
词向量基础单词的表示独热编码存在一下问题:无法以一个向量的方式表示一个单词的含义向量维度高,且非常稀疏没有衡量两个单词之间的语义相似度由于独热编码的缺点,一种新的方式-词向量(也叫分布式表示)表示方式如下: 独热编码词向量(分布式表示)我们[1,0,0,0,0][0.1,0.2,0.4,0.2]爬山[0,1,0,0,0][0.2,0.3,0.1,0.2...

逻辑回归

2022-02-14
阅读 5 分钟
1.1k
Pre learnObjective function, cost function, loss function: are they the same thing?The meaning of theta\( h(x)=W^TX +b =\theta^Tx\)Linear regressionHypotheses:$$ h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2\tag{1} $$$$ h(x)=\sum_{i=0}^n\theta_ix_i=\theta^Tx\tag{2} $$$$x_0 =1 $$Loss:$$ J(\theta)=\...
封面图