联系我们
地 址:
电 话:
Q Q:
主页 > 窗帘知识 > 窗帘知识

新闻写作机器人的应用及前景展望——以今日头

2018-01-12 16:17  点击数:    北京赛车

  新闻写作机器人的应用及前景展望——以今日头条新闻机器人张小明(xiaomingbot)为例北京赛车:临近里约奥运开幕,新浪体育已全面打响“新动里约”的奥运战略,把“新浪、心动、创新”的三重“新意”充分落实到奥运报道战略的执行中:整合微博、门户、新闻客户端和体育客户端四大平台的优质资源配合前方报道团,输出最具专业性的奥运资讯;力求在平台传统优势的基础上开展突破创新战略;此外,联合微博、一直播、秒拍等新媒体渠道共同搭建用户深度参与模式,提供真正让用户参与进来的交互式体验,让更多身在全球各个角落的华人,实时体验“在里约,在现场”的氛围。

  当前,新闻消息的生成和传播速度越来越快,新闻的时效性也要求越来越高,但与之相对的一则新闻消息的影响力却大不如前。一方面,新闻的半衰期越来越短,另一方面快餐式的新闻充斥网络。媒体行业的激烈竞争使得记者疲于应付千篇一律的消息,即便如此,漏题现象也时有发生。在这些消息上使用机器人写作,使得记者可以从疲于奔命式的抢新闻中解脱出来,对事件背后的新闻线索进行深入挖掘和批判性地思考。从长远看来,深度报道对新闻界是有百利而无一害,甚至可以让快新闻逐渐慢下来,也给予读者思考与品读的时间。

  这次小明发布的新闻可谓面面俱到,对每一场比赛都进行了报道。然而,由于模块式的报道,难以回避的一个问题就是千篇一律,每篇报道的结构甚至是用词用句都差不多,缺乏亮点和重点,难以给读者留下印象。例如,我们选取小明在羽毛球男单、男双、女单、女双四场比赛(图3),可以看出,小明使用了大量相同或相近的词语,且句子的排列顺序都近乎相同:第一句先将新闻要素——时间、人物、地点、事件进行了说明。之后是对赛况的说明——精彩纷呈,高潮迭起。然后说明比赛时间、比赛规则、比赛结果、比分结果等。可以看到模板化复制痕迹很突出,且面面俱到,连赛制、体育场馆、排名都详细说明。但很明显缺乏亮点和重点。

  目前来看,新闻机器人的写作能力还仅仅停留在某一领域。一方面,现有的机器人写手不像人类一样,可以眼观六路耳听八方,它的处理器能力还很单一。交叉数据的处理能力很弱。其次,数据库的开源也是制约新闻机器人跨领域工作的一个障碍,机器人写手只有接入到相应的数据库中才能继续进行分析数据,加工模板,再套用写作。不同数据库之间的开源以及数据的整合使得机器人的跨领域写作有一定阻力。因此,像新华网的快笔小新,它其实是有3个分身,每个分身各处理一个领域的新闻消息。但是,机器人的发展不可能局限于某一领域。随着其数据处理能力的增强,以及数据开源成为可能。跨领域的机器人新闻写作将成为可能,这样一来,不仅大大节约了成本,而且写出的稿件将更加全面,不同数据库的资料可以相互补充,取长补短。写作的类型也将不仅仅局限于短消息。使得人物通讯、甚至时事评论成为可能。

  新闻机器人,或者叫AI机器人。是人工智能在新闻领域的最新应用。其实,在“张小明”出现以前,新闻机器人就已被世界上的主流媒体所关注并加以使用。例如,国外有美联社的WordSmith、华盛顿邮报的Heliograf以及纽约时报的blossom等。国内则有新华社的快笔小新、腾讯的dreamwriter、第一财经的DT稿王等。(表1)这些写稿机器人无一例外都运用到了大数据处理技术。首先通过数据采集,将其录入数据库中,在将这些数据按照语句出现频率以及新闻要素关键词进行分析加工。制作出一套符合该媒体发稿风格的模板,然后将新闻元素5W1H代入其中,一篇新闻消息就这样产生了。

  时间对于新闻的意义非同小可,尤其是在当前网络新闻环境之下,可谓是分秒必争。新闻机器人通过之前学习相似稿件的写作模式,凭借其快速的信息处理能力,可以在极短的时间内就写出一篇符合该媒体写作风格的作品。以“小明”为例,在奥运会期间其一篇稿件的完成时间约在2秒左右,也就是说比赛刚一结束,稿件就已经写好发布了。这让其在发稿速度上要快其他媒体一步。其次,发出的稿件可以第一时间发布到社交媒体上,让其消息在众多类似消息中脱颖而出,更容易受到用户的关注。最后,记者在长时间的报道压力下可能忙中出错,而身为机器“小明”可以实现全天候24小时监测赛事热点,既不漏题同时也保证了记者有充分的精力应对关键比赛的详细深度报道。

  新闻机器人所能做的只是在现有数据库的支持下,对文章进行词汇和语句的抓取,然后进行排列组合,就像在进行一个复杂的填字游戏那样。机器人对文章的深度理解能力还远远不能与人类相提并论。例如,在张小明于8月16号关于奥运会男乒半决赛的一篇报道中,它写道:绝望之际,失败女神朝其抛出了橄榄枝。(图2)机器人记者显然没能领会橄榄枝在自然语言中的含义。由此看来虽然身为第二代新闻机器人,在语义理解上仍具有很大缺陷。但随着机器学习能力的不断提高,相信这种低级错误是完全可以避免的。

  而这次成功抢镜的“张小明”是今日头条实验室在里约奥运会开幕一周前研发的AI机器人。它通过对接奥组委的数据库,可以在极短的时间内完成消息撰写,赛事汇总等工作。张小明属于第二代写稿机器人,比起他的前辈们,写稿速度更快——2秒内完成稿件并上传至媒体发布;拟人化程度更高——根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气;发布稿件类型增加——不仅可以发布赛事消息,还可以生成整个比赛的赛事简报;图片识别筛选——可以识别图像,在文章中选取插入赛事图片,图文并茂更加生动形象。

  围绕里约奥运会,新浪体育率先签下林丹、郎平、菲尔普斯、追梦格林、叶钊颖、孙英杰等众多奥运巨星,北京赛车推荐签约女排、举重、摔跤、柔道、自行车、击剑、马术、现代五项、铁人三项,共计9大项目的中国奥运代表队;除此之外,近百名知名媒体人、评论员组成的体育专家阵容,将配合签约的明星资源,为用户带来最权威的第一视角独家内容。《冠军访谈》、《里约最前线》栏目届时将邀请夺冠后的运动员和签约嘉宾明星将出现在新浪体育前方演播室,第一时间分享夺冠历程和征战故事,与用户共同铭记历史瞬间。

  很多人忧虑,由于写作高效客观,表述全面,机器人会取代编辑记者。但从目前机器人新闻的涉及面和功能来看,还不足为虑。所谓的新闻机器人其实只是一个自动化写作程序。称之为机器人还言之过早。它不能对其进行提炼升华、也没有感性的语言作支撑。可以说它只停留在了智的层面,而没有上升到情的高度。这样写出来的文章千篇一律,读者缺乏情感的共鸣。此外,一些人将现在的机器人新闻称为智能新闻,AI新闻其实是不准确的,目前的机器人新闻只是简单的套用模板,简单地对新闻元素做“加法”,真正的智能新闻应该是可以通过文字和人类进行情感的交互的新闻。

  头条实验室负责人李磊博士介绍,“张小明最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨的为每一场比赛报道,无论这场比赛多么冷门和不重要。传统新闻理论并不认为这些冷门比赛或者热门比赛(比如乒乓球)的前几轮小组赛有新闻价值,可是通过我们的平台测试,我们发现对冷门场次的报道任然有可观的阅读量。” 这说明在互联网平台上新闻报道的长尾效应十分突出,即由于受众基数巨大,即使小众用户其数量也十分可观。同时基于互联网平台的新闻传播对个性化新闻需求的满足也有利于用户黏性的增长。这也符合未来定制新闻,分众化新闻的大趋势。

  据悉,这次奥运会新浪体育的排兵布阵独具门道。多年的大赛经验,让新浪体育培养了一批具备深厚实战经验的前线记者。在这次征战里约奥运的记者阵容中,新浪体育充分考虑前线报道团的人员质量,特派了30位资深体育记者驻扎奥运前线,其中有数名都是工作年限在10以上的业界精英。另外在新浪体育后方提供200多人的团队全方位支持奥运报道。这样强大的阵容配合,也确保了新浪体育平台将持续、有效的为用户输出专业、全面、深度的报道和评论。

  在奥运会准备期间,新浪体育做足用户洞察工作,配合“全民奥运”的奥运理念率先提出“社交奥运理念”。利用网络的广泛传播、强大的号召力和互动性让公众从体育赛事单纯的“观众”变成了“参与者”。在奥运会的进行期间,新浪体育将通过多个大众社交渠道,创新式导入打赏、游戏、竞猜等奥运互动玩法。为此新浪体育联合新浪微博、一直播平台、秒拍等众多新兴社交平台,联动式共建“社交奥运”。为了更好地传递奥运的现场感和趣味故事,新浪特别定制了《奥运大主播》、《里约大冒险》等一系列视频节目,集PGC与UGC一体,主角可以是巴西奥运现场的网友、时下网红、草根达人,也可以是专业的记者,他们将使用秒拍或一直播与网友进行现场直播互动,或随手拍下赛事相关视频、照片,并分享至新浪平台。让用户真正参与进来,把奥运盛会从一个盛大的体育节日变成一场集看、聊、玩为一体的欢乐大party。