TP311.11
Web数据挖掘的研究越来越广泛,对Web数据的抽取则是研究的前提和必要的步骤.而当前Web信息大多数都是HTML格式的,存在很多缺陷.针对目前研究,简单地介绍了XML及它的特点,并且对HTMLand XML从开放性、可操作性等几个方面做了比较,显示出了XML的优越性.最后利用一个实例简述了基于XML的数据抽取过程.
李雪竹. 一种基于XML的Web数据抽取的实现[J]. 科学技术与工程, 2008, (9): 2473-2476.LI Xue-zhu. Realized of XML-based Web Data Extraction[J]. Science Technology and Engineering,2008,(9):2473-2476.