本书在Web 2.0和Health 2.0的背景下,基于设计科学、文本挖掘、信息抽取和机器学习等理论与方法,搭建了社会媒体中药品不良反应知识发现框架;实现了特征向量的提取和多种核方法,并基于集成学习和半监督学习,构建了一系列药品不良反应关系抽取模型,识别了药品实体和症状/疾病实体间的关系类别,减少了社会媒体上数据高维特征的影响及模型对标注数据的依赖,提升了药品不良反应关系抽取模型的性能。通过本书的研究,在理论上丰富和补充了文本挖掘、集成学习和半监督学习的理论研究体系;在实践上,有助于完善药品的安全性信息,为相关部门提供决策支持,实现了数据驱动的药物警戒,是面向人民生命健康进行科技创新的重要实践。
展开