北京师范大学中文信息处理研究所恐怕是中国高校里同类机构中年龄最轻的,到现在才五岁。从她诞生那天起,就承担着两项艰难的任务: (1)以HNC理论为主体,探索中文信息自动化处理的技术实现,出成果,出人才; (2)和相关企业合作,尝试着走产一学一研相结合的路子。在自然科学基金和有关部委以及学校的支持下,研究所总算没有辜负各方面的期望,研究工作达到了预期目标①,硕、博士生的培养也如期地、较好地完成了任务。这本论文集就是学生们向学校、向社会所作的一次汇报。
《语言信息处理探索与实践(第1辑)》中所收论文涉及中文信息处理的许多方面:词、短语、句、句群;语义、识别、检索、语境;中外对译、繁简转换,等等。文章或许显得比较稚嫩,但是却有着共同的特点:都是和产业化的需求紧密结合的,也都是比较前沿的课题。
研究所希望能培养出一批“两栖人”,即在语言学和计算语言学两个方面都有相当基础的人才,这是中文信息处理界感到缺憾的老问题,发现、提出多年了,情况依然没有大的改变。我们决定试一试,招收的学生即来自两个专业。学生入学后立即进入项目组,在实践中各自补充另一方面的不足,课程也是两边兼顾,也要结合中文信息处理的实际。与产业结合的教学与科研除了能及时发现基础理论、应用基础理论的不足与偏误,同时还经常遇到具体的、局部的技术问题。学生们的论文题目就从这些问题里选择,这样就自然站在“前沿”了。我们心中的“前沿”,并不全着眼于国内外学术界所提出的新理论、新热点,而是更强调在共同攻关过程中所遇到的新问题、新思路;换言之,我们要让学生始终站在“应用”的第一线上。
一个教学单位把硕、博士生的毕业论文结集出版,这在我国似乎还并不多见。我们之所以这样做,就是想请社会,特别是业内专家、同行通过学生们的“作业”帮助我们判定:我们这样建设中文信息处理这一应用学科的得失与长发。当然,书的出版也是对学生们的鼓励。作为论文的作者们, 自然希望听到对他们作品的批评,而我却更想得到关于如何进一步改进教学模式和方法的批评和建议。
展开