第189章 纳税千万&社会责任(2/6)
是扮演一个倾听者的角色,从尹芙·卡莉介绍的情况来看。
尹芙·卡莉领悟的很快,她已经大致了解了先前林灰给他说的应用分布式词向量处理原始数据。
并且初步按照林灰先前所介绍的理论弄了一个分布式词向量的模型。
这个模型虽然效率还不是很高,但已经有雏形了。
尹芙·卡莉也意识到这个模型效率不是很高了,她不明白怎样做到林灰描述的那般高效率。
林灰看了尹芙·卡莉搞得那个模型,一下子就明白了为什么尹芙·卡莉这个模型效率不够高了。
因为尹芙·卡莉搞得是静态分布式词向量模型,当年最早诞生的分布式词向量的模型就是静态模型。
可静态模型终究不是动态分布式词向量模型。
静态模型效率上多多少少比动态分布式词向量模型要差一些。
不过尹芙·卡莉没能想到构建动态分布式词向量模型这不怪她。
很大程度这是因为一个时空或者说特定一个时代人们思维的局限性了。
林灰可以提点一下尹芙·卡莉的。
但尹芙·卡莉却倔强地表示她要先想想。
还真是个倔强的女人,不过林灰尊重她的想法。
尹芙·卡莉比较好奇林灰先前搞得生成式文本摘要算法的语言模型究竟是用何种方式训练的。
认识十年的老书友给我推荐的追书app,!真特么好用,开车、睡前都靠这个朗读听书打发时间,这里可以下载】
这就涉及到监督学习和非监督学习之辨了。
一般来说,涉及到自然语言处理这个方向基于监督学习的方法首先需要使用人工或半人工方式构建一批所研究领域内的文档的语料,然后选取适当特征训练相应的分类器或序列标注器,再用训练好的分类器或序列标注器对新的文档的每个句子进行标注,将标为候选的句子取出后拼接成摘要。
而基于非监督学习的方法则完全反其道而行之,非监督学习不需要人工或半人工标记的语料库。
如此,基于非监督学习工作量往往要比基于监督学习的工作量要小很多。
而以上只是监督学习和非监督学习一点区别而已,涉及到此二者更深层次的区别一句话两句话根本说不清。
事实如此,一直给尹芙·卡莉聊到下午三点左右林灰才得以脱身。
关于这次谈话的收获,似乎是尹芙·卡莉开始将林灰称呼为“老师”了。
林灰:(⊙﹏⊙),奇奇怪
本章未完,点击下一页继续阅读。