68 阶级(5/7)
去上下游环节寻找机会。”
“大模型的训练需要海量的数据,但计算机能够理解的数据,需要经过分类、标记等预处理。据我所知,大型科技公司一般不会在数据标注这类繁杂但低质量的工作上浪费时间,对吗?”
沈泠点头,“对,他们会找外包,自己招人太麻烦了,而且成本也高,一般是把订单分派给等劳动力价格便宜地区的数据标注员。本来随着机器学习模型的发展,也有一部分数据标注工作被计算机取代,人类员工更多承担审核及纠正错误标注结果的工作,但是现在最主流的大模型发展方向都是‘拟人’,强化学习和人类反馈训练模式重新开始流行,人工标注员的工作又变得重要起来。”
“我明白了,望月,你的意思是,让我们不要去卷数据大模型,而是去创新数据标注的工具!”荆宇城难掩激动,“大家都觉得这不是核心技术所在,所以目前做的人非常少,如果我们能开发出一种新的数据标注工具,适应现有反馈训练模式的需要,绝对会让评审团眼前一亮!”
“不止是评审团,也不只是一个竞赛。”
陈望月微笑起来。
“让我们把视野放得更宽广一点,如果你们真的能做出来,提升数据标注效率,会有很多公司争着抢着跟你们合作的,到那个时候,你们可以把它卖个好价钱,也可以考虑自己创业,做那些数据大模型公司的供应商。”
她的话音量不大,嗓音稳定又温和,恰好一直维持在让这一桌人能够听到的程度,但沈泠和荆宇城的心脏却被她勾勒出的蓝图所深深撼动,无法阻止思绪的摇摆。
面对这份拱手送来的巨大人情,这对情侣对视了一眼,沈泠先开口了,“……望月,谢谢,真的非常感谢你的建议,我和宇城回去会好好和我们团队的其他同学商量的。”
荆宇城也道,“望月,你要不要加入我们的团队,这毕竟是你的创意,如果不能署你的名字就太可惜了。”
“我很有兴趣,可惜不是很有时间,我最近都在忙数竞,还有准备卡赛,实在有心无力。”陈望月笑笑,“而且这个领域目前还不是我的专长,看到有能力、有行动力的人把我的想法变成现实,我会很开心的。”
沈泠有些遗憾,她一直很想和陈望月好好合作一次,无论是她灵光的大脑,沟通的能力,还是背后辛家所代表的资源,都是再难得不过的资本,不过陈望月都把话说到这里了,她也不好再强求。
“那思雨……”
“给你们提供了点子,就不可以抢我的思雨了哦
本章未完,点击下一页继续阅读。