基于句子级别的文本特征提取方法和文档拷贝检测系统