文本相似检测(simhash, singling)