基于语义学习的检索
反馈机制
由来:早期研究中,基于内容的图像检索往往仅仅是视为基于视觉特征的检索,其中图像内容用视觉特征来表示,图像见的相似程度由视觉特征间的匹配程度来表示。然而随着进一步的研究发现,仅仅依赖于视觉特征的图像检索,其结果很难令人满意,因为存在“语义鸿沟”(即是底层的视觉特征和上层的语义特征之间存在断层)。由此便出现了反馈机制。
定义:一般是指用户提供反馈信息和检索系统进行交互。反馈处理就是通过对用户反馈信息进行语义学习来得到底层视觉特征和上层语义特征间的关联性,从而发现用户的实际查询意图,改善检索结果。语义学习方法是用户反馈处理的基础。
代表性的研究工作:
1.基于查询点移动的方法
思想:根据用户反馈处理的结果对查询点进行移动,通过迭代计算对理想查询点进行有效估计.
2.基于最优查询规则选择的方法
思想:将视觉特征最优和语义特征最优综合考虑
3.基于特征权重调整的方法
思想:视觉特征包+语义特征 加权
(以下是根据用户反馈获得语义间的相似)
4.词汇网(Wordnet)将语义相似性引入到检索中
5.用HITS算法提取图像间的关联,综合内容和语义
6.用贝叶斯网络来表示语义关键词与图像视觉特征间的联合概率分布从而达到语义和视觉结合
综上:利用各种方法将 语义特征 和 视觉特征 进行综合学习既是中心思想。
研究重点:基于用户反馈的距离测量学习。 用语义的用户反馈优化视觉的juli函数。
代表性工作:
1.基于SVM 将用户反馈训练成样本集合
2.局部函数的学习:对训练集中每一个图像学习得到一个距离函数
综上:SVM只支持单特征向量。进化成向量集合,传统的SVM便不能有效处理,所以进行改写核函数。
出现包核函数,或者将向量集合转化一个大向量中。还有金字塔匹配核函数(首先将局部特征向量空间进行平均切分得到特征子空间来对局部特征向量进行量化,经过量化局部特征向量集合转化为一个表示局部特征向量在各子空间中数量分布的直方图,在此基础上可以定义计算直方图交的核函数)。
之后有人优化,利用聚类的方法对特征子空间进行更为合理的划分,从而得到更有效的量化结果。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。