基于超文本标记语言的文档信息自动提取技术研究