返回主页全国第十四届计算语言学会议(CCL 2015)及第三届基于自然标注大数据的自然语言处理 国际学术研讨

       “第十四届全国计算语言学学术会议”(The Thirteenth China National Conference on Computational Linguistics, CCL 2015)将于2015年11月13日—14日在广东外语外贸大学举行。作为国内最大的自然语言处理专家学者的社团组织——中国中文信息学会(CIPS)的旗舰会议,全国计算语言学会议从1991年开始每两年举办一次,从2013年开始每年举办一次。CCL着重于中国境内各类语言的计算处理,为传播计算语言学最新的学术和技术成果提供了广泛的交流平台。

       “第三届基于自然标注大数据的自然语言处理国际学术研讨会”(The Second International Symposium on Natural Language Processing based on Naturally Annotated Big Data, NLP-NABD 2015)将与CCL 2015同时召开。NLP-NABD涵盖了前面列举的所有自然语言处理的研究内容,尤其关注在大数据时代自然语言处理的前沿方法和技术。这里所谓的“自然标注”是指由互联网用户根据其自身目的(而不是出于自然语言处理研究的目的)对各种互联网资源进行的“不自觉”的手工标注,计算语言学家们可以将这些标注自觉地和系统性地应用在自然语言处理的各种研究中。典型的例子是,标点符号有助于词边界的识别,社交媒体中的社会标签也有助于关键词抽取,而维基百科中的条目类别信息则可以为文本分类提供帮助。在这些例子中,“自然标注”都是以显式的形式出现的,但在很多情况下,也可以以隐式的形式出现,如短语“Beijing and other cities”“cities such as Beijing”中所蕴含的两个模式“cities such as NOUN”“NOUN and other cities” 就是一种隐式的“自然标注”,可用于抽取常识知识ISA(NOUN, city)。NLP-NABD 2015聚焦国内外在此方向上的各种前沿研究进展,如:如何在自然标注大数据上有效进行大规模无监督/半监督机器学习(如深度学习),如何将学习到的资源、模型和已有的手工标注的核心资源和核心语言计算模型结合起来,等等。