DM和KDD技术,就是在这种状况下应运而生的。DM就相当于学生听了老师的讲解后对知识进行理解的过程。从另一个角度来讲,DM也可被认为是研究人脑如何对所获得的知识进行理解和加工的过程。它是人工智能、机器学习技术发展的结果,其目的是为数据库理解与应用提供自动化、智能化的手段。根据多年经验,每一个熟练的印刷工都有自己的一套解决问题的方法。但是这只是一个通过人脑经记忆和思考得到的解决问题的方法。它不具有通用性,不能为他人所共用,造成人力、物力的大量浪费,同时也不利于科学技术的进步。如果能够根据经验建立印刷数据库,通过印刷数据发掘(PrintingDataMining)技术,得到类似于人脑思考所得到的结果,则是一种理想的解决印刷中所存在问题的方法。它不但可以减少大量的重复劳动,节约人力和物力资源,促进科技进步,而且可以变被动解决问题为主动预防问题的发生。这一点是*为重要的,因为通过PDM技术,不但可以估计到在现有条件下可能出现的问题,而且还能根据问题找出导致该问题产生的主要原因,并提出改进的建议。
举例说明PDM的优点在处理水墨失衡问题时,一般采用加水或加墨的方法来解决问题。但是,在实际印刷作业中,经常会遇到这样的情况:采用加水或加墨并不能很好地解决水墨失衡问题,不是墨色很淡就是出现蹭脏问题,经过理论分析,发现问题在于水斗液中乙醇浓度不够。如果水斗液中乙醇浓度出现问题,采用增加水斗液到印版的方法是难以达到目的的。究其原因是:水斗液虽然量很大,但实质上并没有起到作用。(因为水斗液乙醇浓度不够,水斗液没有能够在印版表面达到良好的铺展,从而不能起到保护印版空白部分的作用。)采用加大水量的方法只能导致印版表面水量存积过多,使得油墨不能良好地转移到印版,印品墨色很淡。这是人工理解所得到的结果。乙醇浓度不足导致了水墨失衡问题,由此问题我们可以想到在印刷业中还可能存在或出现类似的此原因影响彼结果的问题。同时,在长期的印刷业理论和实践中,人们已经积累了大量的各种印刷信息,这些信息中可能早已包含了问题的答案(如水墨失衡因为乙醇浓度不足),但是由于这些信息处于分散和无序状态,所以尽管为人们急需,却没有为人所知。于是就出现了问题答案在身边,可是仍然百思不得其解,仍然盲目地遵循常规解决问题的情况。如在处理水墨失衡问题时,尽管采用加水或加墨并不能很好地解决水墨失衡问题,但仍然采用常规加水或加墨的方法,结果不是墨色很淡就是蹭脏问题出现,*后竟导致了大水大墨的恶性循环。在此基础上运用PDM技术,主动地寻求水墨失衡等类似问题的知识(解决方案和原因),*后得到导致水墨失衡的真正原因??乙醇浓度不足。这种运用PDM技术主动解决问题的方法明显要比人工被动地通过盲目实验得到结果的方法好得多。印刷数据发掘(PDM)的定义印刷数据发掘(PDM)是指从印刷数据库中提取用户感兴趣的特征、不同数据之间的关系及其它一些隐含在数据库中的有意义的数据特征,建立数学模式,通过建立的数学模式发现数据库中先前不知道的、潜在的有用的信息。印刷数据发掘是一个在印刷数据库中进行机器学习的过程,其前提是要拥有一个印刷数据仓库(PDW)。
(完)