如今,绝大多数数据科学家和数据工程师基于高质量的标签数据集训练学习模型。但是,人工构建训练集既耗时又十分昂贵,以至于很多公司的机器学习项目无法完成。在本书中,有一种更为实用的方法,由WeeHyong Tok、Amit Batlree和Senja Filipi展示如何使用弱监督学习模型创建产品。
你将学习如何通过使用Snorkel(斯坦福大学人工智能实验室的一个衍生产品),在弱标签数据集上建立自然语言处理和计算机视觉项目。因为很多公司研究的机器学习项目从未走出他们的实验室,所以本书还提供了如何在真实案例中使用构建的深度学习模型的指南。
·了解弱监督领域的最新进展,包括将其用在数据科学过程中的方法
·使用SnorkelAl进行弱监督和数据编程
·获取使用Snorkel标记文本和图像数据集的代码示例
·使用弱标签数据集进行文本和图像分类
·了解使用Snorkel处理大型数据集和使用Spark集群扩展标签的注意事项
展开