北京白癜风手术需要多少钱 https://m-mip.39.net/m/mipso_4513569.html本文作者即将失业:机器人写稿这事,BAT和今日头条已打得不可开交!
智东西文
四月
导语:在“机器写稿”商业化前夜,故事由BAT和今日头条主导。
上周五,今日头条估值超过亿美元的消息被刷屏。在内容市场的红海里,身价暴涨的今日头条已成为一条让BAT望而生畏的“大鱼”,寡头围剿和壮士突围间充满变数与可能,技术优势牵一发而动全身。
一项内容市场竞争与人工智能技术结合的产物——写稿机器人,将视线聚焦在百度、阿里巴巴、腾讯、今日头条的新战役中,而逐渐起势的机器写稿产业本身也已成为战役中尤为重要的一环。
在深入调查“机器写稿”产业的过程中,意料之外的两大既成事实让我开始重新审视人工智能和内容生产。这两件事实分别是:
1)在垂直领域的报道中,写稿机器人已经被高频率采用;
2)腾讯、今日头条、阿里和百度,是国内写稿机器人技术应用最早和最为成熟的平台。
了解人工智能技术在专业领域的应用现状,能够更为直观地感受技术革命临近的前奏。更进一步,其在内容领域落地的深远意义在于,将为互联网上游资讯生产流程和数据应用方式的带来颠覆式影响。
而在当下,这一关键阀门就掌握在BAT三巨头和估值超亿美元的新劲敌手中。为此,智东西特采访到腾讯内容机器人项目负责人、腾讯财经副总监刘康,阿里巴巴大数据价值挖掘专家、第一财经首席数据专家汤开智博士,今日头条相关专家,行业资深人士,进一步解构这场互联网内容和数据重组的入口之争,窥探背后更大规模的文本范式生成市场。
(注:近日有消息称百度推出了其智能写作机器人Writing-bots,但据笔者调查暂无可查证的实际应用案例,故此文中暂不做讨论。以“度秘”的赛事解说功能为参考。)
一、文字背后的机器人
写稿机器人,并非指实体的机器人本身,而是将机器自动生成文本,产出内容的系统抽象化和拟人化。具体而言,写稿机器人多以特定的信息库为基础,通过一定的筛选、分析、运算等信息处理手段,将信息进行重新组合、排列,并套用事先设置好的写作模板,最终输出新闻报道。
“机器写稿”,背后涉及数据挖掘、自然语言处理、机器学习、搜索技术、知识图谱等多项人工智能技术。套用一般的人工智能的要素模型,“特定的信息库”即支持该项技术的“大数据”,“针对文本信息的重组、排列”即为该项产品背后的核心算法。从早期的人工设定模板,到深度学习引入后的机器自我学习和模板优化,“写稿机器人”本身正在不断进化。
机器人介入写稿最早起始于美国老牌报业《华盛顿邮报》。早在年年末,《华盛顿邮报》就启动了名为“truthteller(吐真者)”的实时新闻核查项目。它能全程记录新闻报道中的文字、语音等信息,随后与“打假”数据库进行对比,一旦发现异常便会发出警报。
从年开始,中外媒体的“写稿机器人”走进版面,开始自立名号。《纽约时报》Blossom、《华盛顿邮报》TruthTeller、《洛杉矶时报》智能内嵌模版、《卫报》Open、路透社的OpenCalais、美联社的Wordsmith六家国际顶级媒体设立各自的机器人服务系统。
在国内,腾讯于年8月率先推出Dreamwriter写稿机器人。随后的一年,今日头条xiaomingbot、第一财经DT稿王、百度度秘解说相继浮出水面。腾讯、阿里巴巴、百度、今日头条,四方割据的局面正式形成。
在信息流市场,第一财经能够代表阿里巴巴的战略布局。在于年阿里的12亿元购入第一财经集团30%股权,随后也将旗下的大数据价值挖掘专家汤开智博士调任至第一财经,任其首席数据科学家,为其自动/辅助写稿产品提供技术支持。
二、四大平台的机器人赛稿
为呈现一个更加具象的写稿机器人市场,笔者集中体验了腾讯、今日头条、百度、第一财经四家产品在用户界面、内容呈现和出稿数量、效率等方面的表现,并对比分析各家在产品布局和应用领域的思路与特点。
1)产品特点与应用状况
从上述图表分析中可以看出,上述四家的“写稿机器人”产品主要还处在自研自用阶段,主要用于自家媒体平台的内容产出和分发。此外,第一财经首席数据科学家汤开智向智东西表示,旗下的DT稿王产品现还应用到电商平台“千牛”的资讯版块。
覆盖领域以体育赛事、和财经类新闻为主,多以短、平、快的处理方式产出赛事战报、快讯等。其中腾讯在新闻内容覆盖面上最广,其产品的对接平台包括腾讯财经、腾讯科技、腾讯体育等。第一财经集团因其更强的媒体属性和广泛的产品渠道,内容分发领域更更广,包括媒体产品端、