在不久前由ETS联合 NAACL-HLT 2018 conference(自然语言处理国际顶级会议)组织的second language acquisition modeling (SLAM) 竞赛中,国内人工智能技术服务公司先声教育在英语语种比赛中,获得第一名。
“这就是在语言学习角度,用户行为数据分析建模的比赛。这个比赛基于Duolingo用户在App上前三个月的数据集训练数据,建立模型,然后预估这个用户在未来三个月的题目能做对,还是能做错。”在先声教育联合创始人兼CTO秦龙的介绍中,先声教育团队是通过深度神经网络进行建模获得第一名成绩的团队,另外一家并列第一的团队则综合运用了深度神经网络和简单决策树模型两种方法。
先声教育成立于2016年4月,公司基于语音识别、语音评测和自然语言处理等核心技术,自主开发的人工智能技术成果目前涵盖了智能语音评测技术、智能写作批改技术、自适应学习技术、智能对话技术以及情感识别五个方面。通过人工智能技术与教育领域的结合,先声教育希望能够尝试解决教育资源不匹配、不均等的问题。
技术让教育更有意义
从卡耐基梅隆大学毕业之后加入国际语言学习平台Duolingo,是秦龙在人工智能+教育领域进行时间的开始。他是同学中少有的选择加入创业公司的人,厉害的创始人和Duolingo自身的高关注度是他做出这个决定的原因。在Duolingo的工作经历,让他开始体会到教育的意义所在。
“你会体会到说,我做的这个事情可以影响到几百万、上千万、上亿用户,他们可能是旅馆的服务员、街上的小商贩。很多时候,这些人不是因为想去国外旅游才学习外语,而是因为他们如果懂得一门外语,就有机会去更高档的餐厅、旅馆工作,工资更高,小费也会更多,可以直接改变自己的生活。这会让你感觉到教育的真正意义所在。”秦龙说道。
秦龙之后选择创业做先声教育,也是希望以技术服务商的身份,帮助教育机构将人工智能技术技术更好的运用到教育领域中,来减轻或者解决教育资源分配不均匀的问题。秦龙认可俞敏洪的一个观点,就是每一次大的工业革命都会降低知识传播的成本,提高知识传播饿的效率,比如工业革命对工人熟练操作机器的需求,促成了现代学校系统的诞生;互联网革命则让不同地区的人有机会在网上享受相同的教育资源。
“人工智能技术对教育的改革可能会是更大范围、更强烈的。互联网解决的是时间和空间的问题,而人工智能解决的是有和无的问题。很多地方没有很好的外教能够纠正学生的英语口语,但是通过人工智能技术学生可以得到更好的指导和反馈。而且人工智能技术还可以为学生课前预习和课后复习提供指导,替代作业批改等一些老师的工作。”秦龙表示,人工智能可以指导学生要做什么事情,也能够判断学生做这些事情的效果如何。
技术需要商业化场景的推动
“当时大家对于语音识别、人工智能远没有现在这么关注,大家都觉得这个技术很有意思,但是没有特别看好的。”秦龙在2003年前后进入中国科学技术大学的人机通讯语音实验室,开始接触和了解语音合成和语音识别技术。直到他2007年进入卡耐基梅隆大学攻读博士的时候,语音识别技术都还没有进入到商业化应用阶段,“整个体验的都很差,但是在实验室里做研究还会觉得挺有意思。”
真正让秦龙感觉到语音识别技术火起来了,是在2011年苹果发布了Siri之后,业界都跟风进行语音识别技术的工作,相关的人才也受到了更多关注。而语音识别技术本身真正迎来大的突破要更晚一点。微软将深度神经网络应用到语音识别里面,让整个语音识别的准确率得到了大幅提升,将整个语音识别技术的研究往前推进了一大步。
“虽然在这之前,Google已经开始建立自己的语音识别团队,但是真正的爆发还是在Siri推出之后。如果没有Siri发布带来的一些大规模商业化应用作为基础,研究团队很难去拿到这么多数据,引入深度神经网络的效果也会比较有限。包括2012、2013年以后,GPU开始被运用到深度神经网络的研究中,也是一个比较重要的因素。”秦龙告诉人民创投(ID:renminct)。
做人工智能领域的产品经理
在秦龙看来,人工智能技术发展到现在,还没有标准化到能够依靠一把钥匙打开所有的锁。现在更多的情况是,在不同领域中会遇到不同的问题,需要找到不同的工具来解决这些问题。在目前人工智能技术落地的场景中,需要对教育、安防、金融等领域的知识有深刻地了解的人与做技术的人一共来制定问题的解决方案。
“更好的情况是做技术的人能够对教育等领域有一些了解。”秦龙表示。先声教育选择做教育领域的人工智能技术服务商的一个优势就是,秦龙以前在Duolingo工作的时候,需要对每一次做得工作进行数据指标的量化,这让他清楚地了解到做哪些事情是真正对用户有影响的,做哪些事情是对用户没有帮助的。
秦龙表示,目前行业内缺少懂人工智能技术的产品经理,来帮助用户理解技术的边界在哪,现在技术可以做到什么,不能做到什么,满足用户更加个性化的需求。“人工智能产品经理,并不需要精通深度神经网络是怎么训练的,而是需要知道在安静的环境下,一个成年母语说话人在语音识别系统中的识别率可以做到95%甚至97%;在噪音环境下大家做得还很差;非母语说话人的识别效果是不行的;成年人和小孩不能适用于同一个模型……”
某种程度上讲,先声教育正在扮演这样一种产品经理的角色。通过给新东方、好未来等教育领域的B端用户提供智能语音和写作评测系统及技术解决方案,一方面能够令自身的技术成果更快速的触达更多的学生群体,更快实现自身缓解教育资源不平等的理想,另一方面,也能以一种更开放的心态来推动人工智能技术与不同领域的结合,通过开放与合作加速技术的进步。
在采访过程中,秦龙会强调先声教育不是一家教育公司,而是一家人工智能公司。从长远来看,秦龙更希望先声教育能够不断积累,将对话、交互等不同的技术融合起来,创造出一个虚拟的人工智能老师,在机器人能够做更多尝试。教育可能是先声教育的技术落地点,但是未来公司并不一定会只做教育这一个领域。
秦龙表示,未来先声教育会在更多技术和场景上进行落地,在语音测评、写作批改之外,打造一个以语言教育为目的的对话场景。“任何一种新技术、新事物的出现都会经历泡沫期,最后也都会回归理性。但技术型公司需要很长时间去发展,也需要创业者和投资人有更多的耐心。”