首页 > 玄幻奇幻 > 穿越:2014 > 第100章 谷歌产生浓厚兴趣

第100章 谷歌产生浓厚兴趣(4/7)

目录
好书推荐: 离婚后莫总天天想上位 盘龙族 海神新娘 四合院:傻柱他二叔,何家守护神 都市逍遥医仙 爱你情深入髓 花都盖世神医 重生军旅不爱红妆爱武装 重生团宠:偏执大佬叫我小祖宗 超级智能修仙系统

反正从谷歌下达的任务的措辞来看。

对于生成式文本摘要算法,谷歌不仅重视。

而且急切渴望获得该技术。

……

然而作为具体的执行人员,对于谷歌提出的任务:

——评估l提出的算法实现的可行性,并根据实际情况考虑能否短时间实现复现

尹芙·卡莉就很无语。

或许在那些屁股决定脑袋的人心中。

清楚技术路线了,技术复现能够实现与否只是时间长短的问题了。

但事实哪有那么简单。

反正进行了一晚上尝试的尹芙·卡莉发现想要进行复现很难。

抛开l提出的算法技术本身不谈。

就是l在生成式摘要算法专利中顺手牵羊搞定的那个“l文本摘要准确度衡量模型”

其他团队想要从无到有的构建一个同样的模型都有亿点困难。

说起来l文本摘要准确度衡量模型的构建过程思路倒是很清晰:

第一,运用语言模型来评估算法生成语言的流畅度;

第二,使用相似度模型评估文本和摘要之间的语义相关性;

第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。

然鹅也仅仅是说起来很简单而已。

说到把大象放进冰箱也很简单同样是三步:

——打开冰箱门,放进大象,关上冰箱门。

知道怎么做没用,关键还是要执行。

没办法执行的话,步骤再清晰也没用。

l文本摘要准确度衡量模型的构建过程有三步。

第一步就很复杂。

该怎么进行语言模型的构建呢?

按照l提出的技术路线。

语言模型建模过程中,包括词典、语料、模型选择等。

问题出在语料库上,语料库一词在语言学上意指大量的文本。

这类文本通常经过整理,具有既定格式与标记。

涉及到英文语料库的信息还比较容易,毕竟尹芙所在的团队和牛津、哈佛、耶鲁三所大学的语言学方面都是深度合作的关系。

但涉及到以及其他文字预料信息该怎么处理这就完全不好说了。

巧妇难为无米之炊。

没有语料库清楚技术路线什么的也没用。

倒是可以姑且先抛弃对以及其他新闻生成式摘要的研究。

但是这样几乎等同于放弃了一个庞大

本章未完,点击下一页继续阅读。

书页 目录
新书推荐: 回村后,从绑定峨眉开始赶山 骑士与魔杖 十里芳菲 星武纪元 剑逆苍穹 道古真神 武逆九千界 我儿快拼爹 瞎子武圣,从说书开始 杀青后,我觉醒了超能力
返回顶部