首页 > 玄幻奇幻 > 穿越：2014 > 第100章谷歌产生浓厚兴趣

第100章谷歌产生浓厚兴趣（4/7）

好书推荐：离婚后莫总天天想上位盘龙族海神新娘四合院：傻柱他二叔，何家守护神都市逍遥医仙爱你情深入髓花都盖世神医重生军旅不爱红妆爱武装重生团宠：偏执大佬叫我小祖宗超级智能修仙系统

反正从谷歌下达的任务的措辞来看。

对于生成式文本摘要算法，谷歌不仅重视。

而且急切渴望获得该技术。

……

然而作为具体的执行人员，对于谷歌提出的任务：

——评估l提出的算法实现的可行性，并根据实际情况考虑能否短时间实现复现

尹芙·卡莉就很无语。

或许在那些屁股决定脑袋的人心中。

清楚技术路线了，技术复现能够实现与否只是时间长短的问题了。

但事实哪有那么简单。

反正进行了一晚上尝试的尹芙·卡莉发现想要进行复现很难。

抛开l提出的算法技术本身不谈。

就是l在生成式摘要算法专利中顺手牵羊搞定的那个“l文本摘要准确度衡量模型”

其他团队想要从无到有的构建一个同样的模型都有亿点困难。

说起来l文本摘要准确度衡量模型的构建过程思路倒是很清晰：

第一，运用语言模型来评估算法生成语言的流畅度；

第二，使用相似度模型评估文本和摘要之间的语义相关性；

第三，为了有效评估实体、专有词的复现程度，引入原文信息量模型来评估。

然鹅也仅仅是说起来很简单而已。

说到把大象放进冰箱也很简单同样是三步：

——打开冰箱门，放进大象，关上冰箱门。

知道怎么做没用，关键还是要执行。

没办法执行的话，步骤再清晰也没用。

l文本摘要准确度衡量模型的构建过程有三步。

第一步就很复杂。

该怎么进行语言模型的构建呢？

按照l提出的技术路线。

语言模型建模过程中，包括词典、语料、模型选择等。

问题出在语料库上，语料库一词在语言学上意指大量的文本。

这类文本通常经过整理，具有既定格式与标记。

涉及到英文语料库的信息还比较容易，毕竟尹芙所在的团队和牛津、哈佛、耶鲁三所大学的语言学方面都是深度合作的关系。

但涉及到以及其他文字预料信息该怎么处理这就完全不好说了。

巧妇难为无米之炊。

没有语料库清楚技术路线什么的也没用。

倒是可以姑且先抛弃对以及其他新闻生成式摘要的研究。

但是这样几乎等同于放弃了一个庞大

本章未完，点击下一页继续阅读。

新书推荐：回村后，从绑定峨眉开始赶山骑士与魔杖十里芳菲星武纪元剑逆苍穹道古真神武逆九千界我儿快拼爹瞎子武圣，从说书开始杀青后，我觉醒了超能力

第100章 谷歌产生浓厚兴趣（4/7）