打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类

NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类


输出结果


设计思路

核心代码

lda = gensim.models.ldamodel.LdaModel(corpus=corpus, id2word=dictionary, num_topics=20)
print('输出第10号分类:',lda.print_topic(10, topn=5))  
print('输出所有的主题分类:',lda.print_topics(num_topics=20, num_words=5))    

 

训练数据集

下载链接:希拉里邮件数据集

LDA模型应用

使用训练好的LDA模型,输入以下几句话,判定各自属于哪个topic

Already voted? That's great! Now help Hillary win by signing up to make calls now
It's Election Day! Millions of Americans have cast their votes for Hillary—join them and confirm where you vote
We don’t want to shrink the vision of this country. We want to keep expanding it
We have a chance to elect a 45th president who will build on our progress, who will finish the job
 

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【NLP基础】NLP关键字提取技术之LDA算法原理与实践
【专知荟萃16】主题模型Topic Model知识资料全集(基础/进阶/论文/综述/代码/专家,附P...
文本相似度计算(1)-文本向量化
通俗理解LDA主题模型
LDA主题聚类学习小结
概率主题模型简介 Introduction to Probabilistic Topic ...
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服