主题模型综述课件

上传人:尘*** 文档编号:243000923 上传时间:2024-09-13 格式:PPT 页数:14 大小:217.50KB
返回 下载 相关 举报
主题模型综述课件_第1页
第1页 / 共14页
主题模型综述课件_第2页
第2页 / 共14页
主题模型综述课件_第3页
第3页 / 共14页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,主题模型概述,THOMAS HOFMANN,Department of Computer Science, Brown University, Providence, US,A,Unsupervised Learning by Probabilistic LatentSemantic Analysis,Content,Latent semantic analysis(LSA),SVD,Probabilistic latent semantic analysis(PLSA),Expect Maximum(EM),LDA(Latent Dirichlet Analysis),各种变种及应用(扩展部分),LSA,主要用于文本分析,思想:找低阶的矩阵对terms-doc矩阵进行分解,得到doc的潜在语义,可以处理多义词和同义词的问题,求解方式:SVD(奇异值分解),SVD奇异值分解,词项文档矩阵做SVD分解,求解方法:,迭代法、并行方法、求NN的特征值法,PLSA,Generate model,其中:,P(di),:表示生成这篇文章的先验概率,P(zk|di),:表示在,di,这篇文章中选择主题,zk,的概率,P(wj|zk),:表示在,Zk,主题下选择单词,wj,的概率,最大似然函数,EM(期望最大化算法),EM算法的步骤是:,(1)E步骤:求隐含变量Given当前估计的参数条件下的后验概率。,(2)M步骤:最大化Complete data对数似然函数的期望,此时我们使用E步骤里计算的隐含变量的后验概率,得到新的参数值。,两步迭代进行直到收敛。,解决方法(MLE),拉格朗日乘子法,求解方程组得到,LDA,涉及到的数学知识,概率,条件概率、贝叶斯、,GammaBetaDirichlet,分布、共轭分布、随机过程之马尔科夫链,随机抽样:,MCMC,、,GibbsSamples,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!