本书基于作者多年来对于文本大数据的研究成果创作完成, 主要分为两部分内容。第一部分包括前5章, 基于主题模型, 首先介绍了基础的主题模型及其推断、评价方法, 然后介绍了多语料联合、动态稀疏等多角度的主题模型, 以及主题模型的变点检测方法。第二部分包括后3章, 基于机器学习和深度学习模型, 包括文本分层分类模型、异质图新闻推荐模型以及基于多层级信息的多模态属性级情感分析模型。书中每种方法均配有实际分析案例。