找回密码
 会员注册
查看: 5|回复: 0

tcad提取关键参数_阅读时怎样提取关键信息

[复制链接]

5

主题

0

回帖

16

积分

新手上路

积分
16
发表于 7 天前 | 显示全部楼层 |阅读模式
前沿 一、实例 基于jieba包的关键词提取 基于textrank4zh包的关键词提取 这个包不止能提取关键词,也能返回每个关键词的重要性程度得分;以下结果不同于jieba,主要是因为其默认的词性筛选不同; 二、结论 基于TFIDF和TextRank的关键词提取算法的效果和分词效果关系很大。如果不添加词汇深度学习,分词时会将深度学习划分为深度和学习,那么在用TFIDF提取关键词时,将无法出现深度学习这一关键词。理论上来说TextRank可以实现词汇粘合,前提是深度学习均作为关键词被提取出来了。但在这个实例中,若不添加深度学习,基于TextRank的关键词提取虽然均提取出了深度和学习作为关键词,却并没有将其粘合。 从实例中可以看到,TextRank的效果并不优于TFIDF。 TextRank虽然考虑到了词之间的关系,但是仍然倾向于将频繁词作为关键词,而且TextRank涉及到构建词图及迭代计算,所以提取速度较慢。  
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-9 01:52 , Processed in 0.529177 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表