全本书屋

第82章 领先一代半的算法

天才一秒记住【全本书屋】地址:qbshuwu.com

而此时处在舆论漩涡之中的林灰在干什么呢?

当然是在废寝忘食地查阅那些跨越时空的“参考资料”。

这里面有价值的信息太多了。

很多在后世平平无奇的东西放到眼下这个时空中都是乱杀的存在。

但林灰没有被激动的情绪所左右。

因为林灰始终清楚领先半步是先驱,领先一步是先烈。

技术真领先个一年半载还好说,冷不丁一下子领先别人四五年就出大问题了。

只有能够契合14年这个时代背景的技术才是林灰寻找的有价值的东西。

在前世那部thinkpad里几乎没翻找多长时间。

林灰就找到了他的猎物:

——生成/抽取复合式新闻摘要算法。

这种算法在前世并不算特别新鲜的玩意。

林灰之所以看中它是因为这个算法成熟。

某种程度上成熟就意味着稳定、性能可靠。

林灰几乎可以不再经过额外的调教就直接拿这种算法开发之前他构想的那个新闻摘要软件。

当然了,这个算法也只是在前世那个时空不算新鲜而已。

放到14这个时空里,依旧是领先一年的技术。

虽然只领先一年,也完全够用了。

就算是只领先半年,也照样让你绝望!

你没打破我垄断之前,我各种高价讹诈赚取巨额利润。

你打破我垄断了,我直接白菜价跟着你一块摆烂。

气不气?

别人气不气不知道。

反正兔子已经气得想咬人了。

更何况算法这种东西迭代本来就快!

领先一年时间几乎等同于技术方面领先一代了。

而生成/抽取复合式新闻摘要算法更是领先14年这个时空主流新闻摘要算法一代半。

这可不是林灰夸张。

事实上,现在的新闻摘要自动生成的方式还是抽取式新闻摘要。

抽取式顾名思义就是按照一定的权重从新闻原文中寻找跟中心思想最接近的一条或几条句子。

抽取式摘要还在用着“古老”的textrank排序算法。

这种算法大体思想是先去除文章中的一些停用词,之后对句子的相似度进行度量,计算每一句相对另一句的相似度得分,迭代传播,直到误差小于0.0001。

之后再对上述得到的关键语句进行排序,以期能得到想要的摘要。

客观来说,这种算法虽然也挺高效。

但问题在于抽取式摘要主要考虑单词词频,并没有考虑过多的语义信息。

也正因为如此,这种抽取式摘要很难获取复杂新闻的核心内容。

而且这种摘要方式的一个极其明显的弊端在于。

抽取式摘要对英文新闻还算能凑合着用。

但对于中文新闻完全是无所适从的状态。

总而言之,抽取式的摘要目前虽然已经比较成熟。

但是抽取质量及内容流畅度均差强人意。

正因为抽取式摘要的种种不足。

之后又出现了生成式摘要算法。

生成式摘要算法得益于深度学习研究的深入。

生成式则是计算机通读原文后,在理解整篇文章意思的基础上,按机器自己的话生成流畅的概括。

生成式新闻摘要主要依靠深度神经网络结构实现。

生成式摘要在理解新闻内容方面相比抽取式摘要有着先天优势。

但这种摘要也不是完全没有弊端。

这种摘要方式很容易受到原文长度的制约。

当把一篇很长新闻放在生成式摘要算法前。

其表现大概率为:(⊙﹏⊙)太长不看!

而生成/抽取复合式新闻摘要算法则综合了抽取式摘要算法和生成式摘要算法的优点。

对于较长的新闻,利用该算法可以实现先抽取核心内容。

再在核心内容的基础上进行生成。

总而言之,如果依托生成/抽取复合式新闻摘要算法开发一款软件的话

也完全能够吊打尼克·达洛伊西奥开发的软件。

毕竟尼克开发的软件。

无论是summly还是yahoonewsdigest(雅虎新闻摘要)

这些都是基抽取式算法的。

生成/抽取复合式新闻摘要算法在效率方面可以说是吊打抽取式摘要算法。

不过话说回来这么弔的算法只开发一个软件然后卖出去。

似乎有点太亏了。

怎么说也是领先于时代的技术。

似乎可以水几篇论文什么的。

呃,不过高中才毕业就发表论文的话似乎有点过于惊世骇俗了。

究竟怎么做才能物尽其用呢?

小说推荐:《洞中避难所》《仗剑独行斩鬼神》《圣拳!》《古代农家养娃种田日常》《我能继承角色天赋》《你们修仙,我种田》【大红书】《不正常型月》《人在华娱,职业奖励是间谍》《谍海青云

《穿越:2014》转载请注明来源:全本书屋qbshuwu.com,若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

新书推荐

爹死跟娘被拐改嫁我养大弟妹成家请你,记得我来过开局抢天赋?我刨你家祖坟国运求生:娇弱的我靠幸运值带飞霸婿崛起浮萍都市医仙,女总裁们最强救星神级傻婿假千金出狱后全家都被逼疯了妻子不愿意给我生孩子却给情人生重生入官场,草根变凤凰穿的每个世界主角都有病怎么办爱吃狗香肠的小奇哥的新书凡人的平凡一生民国穿越女掌柜七零不做冤大头,下乡赶山娶村花穿越六零:丈夫带我进城了视频通万界:开局猴哥上榜重生93:拎着麻袋去捡漏最强渔夫:海岛奶爸我一堂堂演员绑定个曲库有啥用?官场小白到主政一方不当舔狗后,她哭着跪求我回来臭弟弟,下山来祸害你师姐啊在民族资产的路上炮灰:女友前世是病娇小男娘梦想成真却是1958全球资本家:从大学开始当首富绝世神龙说好演反派,你怎么假戏真做了?我刚觉醒系统,她爸让我滚远点?萌宝大佬不好惹,打着奶嗝躺赢了离婚协议撕三次,带崽二婚他哭崩了被迫与校草做情侣重生做股神凡人寻长生:科学修仙录透视医武在身的外卖骑手踏准风口成巨富渣夫处处护寡嫂,我靠兽语成国宠!惊!天机门小公主又在摆摊算命