第165章 你渴望推开那扇门么(2)(3/3)
一种方法。
据林灰所知基于知识库的语义文本相似度计算方法根据知识库的类型其实是可以分为两大类。
除了基于网络知识方法的话。
还有一类是基于本体的方法。
这类方法运用结构化语义词典进行计算。
其基本思想就是运用这些语义词典中包含的概念信息和概念间的层次关系进行语义文本相似度计算。
按理说既然想到了基于知识库的语义文本相似度计算方法的话应该首先想到基于本体的相似度计算方法才对才对啊。
推荐下,追书真的好用,这里下载大家去快可以试试吧。】
为什么没先想到基于本体的方法?
反而先想到了基于网络知识的方法?
回想起尹芙先前的自我介绍,林灰恍然大悟。
尹芙的团队没想到这种方法也可以理解。
毕竟尹芙他们的团队原本是和谷/歌方面深度合作的。
基于网络知识的方法利用网页内容和超链接相似度进行计算的话虽然不容易。
但谷/歌的老本行pagerank算法引入到nlp领域后实现的功能本就跟这个差不多。
这样看来,和谷/歌方面的团队有过深度合作关系的尹芙团队忽视基于本体的方法而直接选择基于网络知识的方法也是可以理解的。
说起来基于网络知识方法计算相似度实现起来并不容易。
毕竟网页中知识颗粒度较粗。
说白了就是网页中有用的东西少。
加之部分网页的知识结构化程度较低。
如果直接对所有的网页链接进行分析,会导致知识含量稀疏、计算困难等问题。
因此必须找网页结构高同时知识内容集中的网页才适合开发基于网络知识评估文本相似度的方法。
什么样的网页具有这一特征呢?
wk百科和摆渡百科。