收藏本站|在线留言 |网站地图您好,欢迎光临幸运飞艇爱彩娱乐平台!   

全国咨询电话
400-800-8888

严谨的技术创新追求,无微不至地服务于客户
为客户提供最优质的产品
专注实验仪器领域20年,仪器行业领导品牌
当前位置:主页 > 新闻资讯 > 公司资讯 >

连线》解读机器人如何写深度报道占领新闻界

字号:T|T
 文章来源:未知编辑:-1时间:2018-08-06 07:32

  “得克萨斯州弗里奥纳,星期一,弗里奥纳队尽管有7次安打和8次得分,还是在第五局以10:8负于农场男孩队。弗里奥纳队当天的开局完美无瑕,在本垒亨特·桑德尔就力克农场男孩队的投球,打出了个2:2.此后,桑德尔在第3局击出一垒安打,在第4局击出了3垒打……弗里奥纳队的盗垒不胜枚举,总共8次盗垒成功……”

  这家新兴公司的首个客户是一家电视新闻网,任务是报道十大联盟体育赛事。公司的软件将以近乎实时播报的方式,对数千场十大联盟比赛进行报道。以橄榄球比赛为例,每一局结束后,报道就要更新。N arrativeScience还受托报道女子垒球大赛,成为那场比赛中全美最多产的报道者。

  哈蒙德向我保证,我没有什么好担心的。他坚持说,机器新闻这场大海啸不会将仍在领取工资的人类记者彻底抹掉。恰恰相反,随着电脑能够挖掘大量数据,写出成本极其低廉、而且又完全可读的事件、趋势和发展报道,新闻写作世界将会急剧扩张,因为这些领域都是目前没有记者涉足的。

  但是,即使N arrative Science永远不能学会用琼·迪迪昂(JoanD idion)那种冷冰冰的精确语言进行普利策水平的题材挖掘,也照样可以大赚其钱,因为我们的生活和世界正越来越多地被转换成数据。举例来说,过去几年来,职棒大联盟耗资数百万美元,建立了一个由高清晰度摄像机和强大传感器组成的精细系统,以评估发生在赛场上的每一件事:投球的速度和轨道,可以精确到英寸;任一时刻接球手所站的位置;游击手去接一个滚地球时到底移动得有多快。有些时候,真相可能就藏在这些数据里。可能球队经理没能发现自己的投球手在对手进行致命一击之前,面对前面好几位击球手就已经显示出筋疲力尽的迹象。或许是游击手卖力接球才避免了6次安打。这些东西,即便是经验丰富的棒球记者也可能会注意不到,但是对于一种电脑算法来说,发现这些毫无问题。

  而报道的主题也越来越变得多元化。一家快餐公司请N arrativeScience每月写一篇关于其连锁店的报道,内容主要是分析各店的销售数据,将它们与当地同行对比,并提出某些特别菜式,意在推荐。此外,由于以这种方式把数据转化成故事成本非常之低,所以即使只有一个读者,也非常实用。N arrativeSci-ence正考虑“生产”个性化的401(k)财务报告以及《魔兽世界》会话概要———这样在大型突袭之后,玩家能够拿到一份综述,读起来仿佛有一名内置的“随军记者”一直陪着他们冲锋陷阵。“网络产生的数据比其他任何东西都多,而这家公司负责把数据变成词句。”D oubleC lick前首席执行官戴维·罗森布拉特(D avidR osenblatt)说,目前他是N arrativeScience董事会成员“N arrative Sci-ence有存在的必然性。新闻报道也许只是咝咝作响的烤肉声,而真正烤着的牛排则是管理报告这一块。”

  N arrativeScience公司的团队还提供定制服务,让客户自己就报道的基调提出要求。“你想要什么类型的报道都可以,可以像一个激动的金融记者从交易所发出的尖叫,也可以是一个书生气的研究员书领着你干巴巴地分析那些数据。”乔纳森·莫里斯(JonathanM orris)说,他是金融分析公司D ataE xplorers的首席运营官,该公司利用N arrativeScience的技术设立了一个证券新闻专线(莫里斯的定制要求是:以一位受过良好教育、坦率直接的专业金融记者的口吻进行报道)。还有一些客户则喜欢随意犀利、不时扯点闲篇的博客调调。“撰写文笔轻松的报道并不比撰写直截了当、美联社风格的报道更加困难,”N arrative Science的产品副总裁拉里·亚当斯(Larry A dam s)说,“我们可以用迈克·洛伊柯(M ikeR oyko,芝加哥专栏作家,以简洁犀利、令人生畏的写作风格著称)的方式报道股票市场。”

  这并不是说机器的新闻创作将一直停留在边缘地带,仅限于撰写更多少年职业棒球联盟报道,或者用刻板的公式语言堆砌出经济预测。有一个预言,说在20年内,电脑会赢得普利策奖。不久前有人问哈蒙德对这样的观点怎么看,哈蒙德表示反对。他说,这件事必将发生,不过不是在20年内,而是在5年之内。

  不,这不是著名棒球作家罗杰·安吉尔(R ogerA ngell)的手笔。但是美国少年棒球联盟队员的祖父母们读到这篇赛况综述时———甚至在两队握手结束比赛之前,它便出现在网上———会觉得它像任何体育栏目中的文章一样流利可读。N arrativeScience的算法利用棒球队员的父母们输入iP hone插件G am eC hanger的投球数据写出了这篇文章。去年这个软件写出将近40万篇关于美国少年棒球联盟比赛的报道,今年这个数字估计要超过150万。

  不过,至少在目前,哈蒙德还是试着让记者安心,说他并不打算在他们已经落魄的这一刻踩上一脚。他讲到自己和妻子参加的一个派对。他妻子是芝加哥著名的第二城市即兴表演俱乐部的营销主管。在派对上他碰到当地一位有名的戏剧评论家,后者问哈蒙德在干什么。当哈蒙德解释自己公司的业务时,这位评论家变得十分激动。新闻业的日子已经够难过的了,他说,现在你还想用机器人取代记者?

  哈蒙德认为,随着N arrativeScience的成长壮大,其报道水平会越来越高,直至进入新闻业的食物链———从日常新闻到解释性报道,最终写出详细的长篇深度报道。也许到了某个时候,人类和算法会携起手来,各自发挥自己的强项。电脑凭借它们毫无瑕疵的记忆力和提取数据的能力,可以成为人类记者的资料搜集助手。或者反过来,人类记者可以采访某个题目,然后把各种各样的细节写下来,输入电脑,让它把文章写出来。随着电脑越来越先进,信息处理能力越来越强,它们作为故事讲述者的局限性会逐渐消失。这也许还需要一段时间,但事到最终,哪怕是本文这样一篇报道,没有我,电脑也能把它写出来。“人类的丰富性和复杂性难以置信,但它们是机器,”哈蒙德说,“20年内,没有一个领域的故事是N arrative Sci-ence写不出来的。”

  现在,认真想想这样一件事:每隔大约30秒钟,N arrative Science公司(共有30名员工,在芝加哥卢普商业区边上拥有一处不小的办公场所)的电脑写手就会完成一篇文章,至于标题下面应该署谁的名,倒是一个需要进行哲学探讨的问题。这些用电脑写出来的文章可能是十大联盟(BigTenConference,指美国中西部十二所大学组成的体育竞技联盟)篮球锦标赛下半场最新战况跟进,也可能是对于某个公司损益表的冷静分析,或者是根据T w itter帖子中的观点,对于总统候选人大战进行一次轻松愉快的总结。这些文章刊登在一些著名出版者的网站上———比如福布斯,也出现在其他网络媒体巨头上(它们多数不愿披露自己的身份)。一些小众新闻服务机构则请N arrative Science为他们的订阅用户创作内容更新,不管他们是体育运动迷,小盘股投资者还是快餐连锁店经营者。

  不过,目前公司的核心业务仍是新闻写作。和任何刚出道的记者一样,N arrativeScience梦想着荣耀———找到好的新闻线索,做出轰动的报道。为了达到这一目标,它必须投入巨资,开发更先进的机器学习和数据分析技术。它还得更加深入地钻研人工智能,让机器理解自然语言,这样才能访问和解读无法用电子图表表达的信息和事件。在这方面它已经取得了一点成绩。“在金融世界,我们在阅读头条,”哈蒙德说,“我们可以识别某些公司的股票是涨了还是跌了,某个人是被解雇了还是受聘了,某个人正在考虑合并,我们知道这些事件和股价之间的关系。”哈蒙德希望看到公司软件关于大学联盟体育赛事的报道中能包含更高级的信息,比如运动员伤病或者打官司等情况。

  但是双方签订合同后没多久,一个小小的问题浮出水面:N arrative Science的报道似乎总把焦点放在胜利者身上。当一支大十联盟队伍被联盟外对手打得落花流水时,软件写出的捧场文章看上去完全是一种羞辱。联盟官员要求N arrative Science找到一种办法,让报道的主调一直以褒扬十大联盟成员的表现为主,哪怕他们输了比赛。面对这样的要求,人类记者可能会十分生气,但N arrative Science的工程师并不觉得有什么问题,他们只需要改变软件的参数。同样,当公司开始报道少年职业棒球联盟的比赛时,它也迅速明白一个事实:队员的父母不想读到关于他们孩子犯错的内容。因应这种需求,软件作出调整,忽略那些漏击的高飞球,专心描写队员们的豪言壮语。

  “我只是看着他,”哈蒙德回忆说,“然后问他:你在美国少年职业棒球联盟看到过记者吗?这就是我们公司业务最重要的一方面。没有一个人因为我们而失去工作。”

  斯图亚特·弗兰克尔(S tu a rtFrankel)原是在线广告公司D oubleClick的管理人员,在G oolge将该公司收购后离开,他也是那天应邀到西北大学看演示的来宾之一。“当这些孩子做介绍时,房间里的气氛为之一变,”他说,“但它还只是一个小软件,只会写关于棒球比赛的报道———功能非常有限。”弗兰克尔继续跟哈蒙德和伯恩鲍姆保持联系,以了解该项技术的最新进展。这个系统能否利用任何类型的数据,写出任何类型的报道?它能否写出质量上乘的稿子,让读者心甘情愿地掏钱订阅?对方给出的答复相当肯定,这让弗兰克尔相信,“这里面真的蕴藏着很大的、激动人心的商机。”于是三人合作,于2010年成立了N arrativeScience公司,弗兰克尔担任首席执行官。

  到了学期末,这个班级举行了一个“展示日”,学生们向整整一屋子来自ESPN、赫斯特传媒集团和《芝加哥论坛报》的高管演示了他们的作品。StatsM onkey的介绍给他们留下了特别深刻的印象。“他们将分数表和比赛详情输入程序,然后在不到12秒钟的时间里,该程序就从职棒大联盟40年历史中抽取有关例子,写出了一则比赛报道,找到了最佳图片,并附上了图说。”梅迪尔学院院长约翰·拉文(JohnLavine)说。

  而事实证明,N arrativeScience非常善于满足这样的需求。当公司刚刚起步、接手这些业务的时候,每次系统处理一个新主题,“后写作者”都不得不非常费力地对它进行“教育”。但是时隔不久,他们就开发出一个平台,使得算法可以更加容易地学会适应新的领域。比如说,其中一位“后写作者”决定设计一个故事写作机器,它可以“生产”关于某个特定城市最佳餐厅的文章。她利用一个餐厅评级的数据库,迅速教会软件如何识别相关内容(更高的级别评定、较好的服务、美味的食物,以及一位满意的顾客所作的点评,等等)并插入一些连接性的句子。只用了一个小时,她就做出一个工具,可以写出无数活泼可爱的小文章,比如《亚特兰大最佳意大利餐厅》、《密尔沃基最棒的寿司》之类。

  NarrativeScience的写作引擎工作时要分好几步。首先,它必须收集到高质量的数据。因此,自然而然,金融和体育成为它首先写到的主题:两者都涉及数字的涨落和波动———每股收益、低买高沽、投手责任得分率(ER A)、击球跑垒得分(R BI),等等。而且,那些数据控们会不停地创造出新的数据库,让报道变得更丰满。比如说,棒球迷们建立了一种模型,可以随着比赛的进行,预测一支球队在每种情况下胜出的比率。所以如果在一次上场击球时,突然有某种意外发生,改变了这支队伍的胜算几率,从40%变成了60%,那么软件就可以在写作时特别强调这一点,把它写成比赛开场以来最具戏剧性的一刻。然后软件就必须根据该数据对主题作出更宽泛的理解,比如说它们应该明白,“得分”数字最高的那支队伍会被宣布为比赛的胜者。

  福布斯传媒首席产品官刘易斯·德沃肯(Lew is D vorkin)说,他对这个软件印象深刻,但对于这位“网络特约记者”几乎在任何情况下都可以准确把握它们报道的公司的精华,他并不感到吃惊。活生生的记者写的稿子有时难免出现大疏漏,但德沃肯至今从未听说有读者投诉自动化报道。“一个也没有。”他说(福布斯网站上刊登的这类报道会附有一项解释,说明是“N arrativeSci-ence利用其专利人工智能平台将数据转换成以上报道和观点”)。

  N arrative Science的首席技术执行官和创始人之一克里斯汀·哈蒙德(K ristianH am m ond)的小办公室离程序员和工程师们那忙碌的工作间只有几英尺。对哈蒙德来说,前面提到的这些报道只是第一步,他们最终的目的是建立一个由电脑所写报道占据着统治地位的新闻世界。到底是怎样的统治地位呢?去年,在一个由记者与技术人员参加的小型会议上,我请哈蒙德预言15年后会有多少新闻是由电脑写成。一开始他想回避这个问题,但在我的催逼之下,他最后叹口气,屈服了:“超过90%.”(来源:南方都市报 南都网)

  哈蒙德在犹他州出生长大,他父亲是一位考古学家,在该州一所大学教书。哈蒙德一直以为自己将来会成为一名律师。但是到了上世纪80年代末,在耶鲁大学就读时,他深受罗杰·尚克(R ogerSchank)的影响。罗杰·尚克是一位著名的人工智能研究者,耶鲁大学计算机科学系主任。在取得计算机科学方面的博士学位后,哈蒙德受聘于芝加哥大学,领导一个新创建的人工智能实验室。上世纪90年代中期,就在那里,他做出了一个系统,可以跟踪读者的阅读和写作习惯,然后向他们推荐相关的资料和文件。哈蒙德以这项技术为核心,建立了一个小型公司,后来又把它卖掉了。那时他已经转到西北大学工作,成为该大学智能信息实验室(Intelligent Inform ationLabor-atory)的主任之一。2009年,哈蒙德和同事拉里·伯恩鲍姆(LarryBirnbaum)在梅迪尔学院执教一个班,这个班上的学生既有程序员,也有未来的记者。他们鼓励学生写出一种软件,可以把已有数据变成平实的报道。其中一位学生是《芝加哥论坛报》的兼职记者,负责报道高校体育。他和另外两名新闻系学生与一名计算机科学系学生结对,做出一个原型软件,名为StatsM onkey,可以根据比赛分数和每一场的详细数据写出非常可信的大学棒球比赛报道。

  N arrative Science在自动报道写作领域的主要对手,北卡罗莱纳一家最初名为Stat Sheet的公司,也在以类似方式扩展自己的业务。它无法与拥有梅迪尔学院血统的N arrative Sci-ence正面竞争,所以主要扎根在仅有一两份报纸的小镇,担当的是新鲜活泼小报的角色。它也是以体育报道起家,除了报道职棒大联盟和大学比赛,还做了一个无聊话题发生器,名为StatSm ack.在意识到把数据转化为文章可以带来比体育报道更大的机会时,这家公司把名字改为A utom atedInsights.“过去我常对我们应做的业务给出一些限定,认为我们的报道会专门针对一些数据丰富的行业,”该公司创建人罗比·艾伦(R obbie A llen)说,“现在我认为,一切皆有可能。”

  如果你正看的这篇文章是Nar-rativeScience所写,那它可能不会提到这样一个事实:这家专门“训练”电脑撰写新闻报道的公司在芝加哥的总部离《芝加哥论坛报》报业大厦仅有一箭之遥。它也不会详细阐述这样的历史:这项可能使很多人失业的技术部分是在西北大学的梅迪尔新闻、传媒和整合市场传播学院(M edill School ofJournalism,M edia,IntegratedM arketingCom m unications)孵化出来的。对于人类来说,这些事情的讽刺意味显而易见,但电脑领略不到其中的趣味。

  偶尔算法也会犯下错误,比如有一篇新闻就说一名代打(pinchhitter,一般每场比赛只上场一次)“六击中二”。但是这样的错误比较少见。数字一般不会被错误地引用,哪怕数据库提供了有问题的信息。哈蒙德说,N arrative Science的算法受过“训练”,可以发现那些错误。“如果数据说一家公司从一个季度到另一个季度实现了600%的增长,那么在算法看来,这等于在说,‘这中间有问题,’”哈蒙德说,“人们让我们举出一些特别让人吃惊的、奇奇怪怪的犯错例子,但我们找不出来。”

  所以N arrativeScience的工程师设计了一系列规则,来规范每一个主题———不管它是公司业绩还是体育赛事。但是,如何把这些分析变成文章?公司请了一批“后写作者”,这些人是受过训练的记者,帮助创建了一系列模板。他们与IT工程师一起合作,“训练”电脑辨认数据库中不同的“角度”。谁赢了这场比赛?到底是先输后赢的大逆转,还是一场酣畅淋漓的胜利?比赛这天有没有哪位球员在场上表现特别抢眼?软件还会从其他数据库中搜集背景资料和信息:获胜球队是不是之前连战连败,这次总算终结噩运?

  接下来就是文章结构问题。大部分新闻报道,尤其是关于体育或者金融等主题的报道,遵循着某种非常具有可预期性的写作模式,所以“后写作者”为这类文章设立某种框架和模板会相对容易些。在组织语句时,长丰:民生工程托起困难群众幸福软件会使用“后写作者”为它们汇编好的词汇库。就棒球报道来说,“后写作者”似乎从20世纪早期著名体育专栏作者林·拉德拉那里借鉴了很多说法,总是说“w hack-ing hom eruns”(超帅的本垒打)、“sw ip in g b ag s”(成功盗垒)、“tallyingruns”(赚得一分)、“step-pinguptothedish”(踏上本垒)。公司把最后的成品叫做“narrative”(意为“叙述”或者“故事”)。

  电脑工程师已经编出写诗程序和作曲程序,那他们会不会搞出一种算法,取代记者呢?答案是肯定的。一位研究者信心十足地说,15年后,90%的新闻报道将是“机器记者”所写;而且,不用5年,它们就能夺得普利策奖。

  当N arrativeScience掌握了体育和金融报道的艺术,它就意识到,自己可以比新闻业做得更多。事实上,任何需要阐释和解读大量数据的人都可以从它提供的这项服务中受益。各式各样的客户请求纷至沓来,这些人被埋在如山的电子数据和图表中,不堪其苦。显然,他们很愿意出钱请N arrativeScience把这些令人发疯的信息变成两段清晰易读、直击要点的文字。