郑捷《机器学习算法原理与编程实践》学习笔记(第二章 中文文本分类(一))
2.1 文本发掘与文本分类的概念 文本发掘是指从很多的文本数据中抽取事前不知道的、可理解的、终究可用的常识的进程,一起运用这些常识更好的安排信息以便将来参阅。 查找和信息检索(IR):存储和文本文档的检索,包含查找引擎个关键字查找 文本聚类:运用聚类办法,对词汇、片段、阶段或文件进行分组和归类 文本分