人工智能技术的目标是理解,复制,甚至超越人类的智能。目前最成功的技术路线是模仿人类的“学习”能力和过程,让模型从数据中学习规律和知识。数据在人工智能发展过程中有着至关重要的作用。但是在现实中,获取大量的有标注的数据,比如机器翻译需要的平行语料,是非常不容易的。而另一方面,大量的无标注数据(例如网页文本)却相对容易获得。同时,人具有很强的从大量无标注数据中学到知识和规律的能力,如何给机器也赋予这样的能力,从无标注数据中获得效果优良的模型,是人工智能领域一个活跃的研究方向,具有巨大的价值。 近年来, 该领域有了长足的进展,也有相当多的落地的应用。本次活动邀请到来自高校和互联网企业一线的研究者和技术负责人,从自然语言处理,语音,文本语义理解与信息抽取等多个领域,分享及探讨无标注或者少量标注数据在AI领域的最新学术进展与工业实践。