基于文本和公式的科技文档相似度计算研究