cntext 是专为社会科学实证研究者设计的中文文本分析 Python 库。它不止于词频统计式的传统情感分析,还拥有词嵌入训练、语义投影计算,可从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。 cntext 不追求黑箱预测,而致力于让 ...
在自然语言处理(NLP)领域,很多人会问:如何从零开始,构建一个真正可用的 NLP 流水线? 常见的教程往往只聚焦于某一个环节,比如“训练一个 Word2Vec 模型”或者“跑一次 LDA 主题建模”。但在真实项目中,往往需要一个系统性的流程:从原始文本 → 预 ...
编者按:南京师范大学新闻与传播学院教授高山冰、硕士研究生梁民达在《传媒观察》2025年第10期撰文,通过内容维度、物质维度等方面,分析了县级融媒体的生产传播、社会治理等功能。媒介逻辑嵌入基层治理体系,一方面可以调和基层治理的运动性,导向非 ...
Gensim是一个专为自然语言处理(NLP)和信息检索(IR)设计的Python库,它以其强大的主题建模和文档相似性分析功能而广受欢迎。通过Gensim,研究人员和开发人员可以高效地处理和分析大规模的文本数据,挖掘出隐藏在数据背后的信息。本文将详细介绍Gensim的 ...
主题识别是一种在大量文本中识别隐藏主题的方法。潜在狄利克雷分配 (LDA) 技术是一种常见的主题建模算法,在 Python 的 Gensim 包中有很好的实现(推荐阅读👉 强大的 Gensim 库用于 NLP 文本分析 )。 问题是确定如何提取独特、重要的高质量主题。这取决于文本 ...
媒体镜头下的女性角色能反应一个社会的女性主义崛起。 今天,文摘菌给大家介绍的这个项目,就是希望通过情感分析、频繁术语可视化和主题建模,来调查过去70年里女性在《纽约时报》报道中的代表性。 一起看看。 为了进行这项调查,作者通过《纽约时报 ...
导语:帮助对机器学习、数据挖掘感兴趣的读者整合时下流行的基于Python语言的程序库。 本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉 ...
本课程面向非计算机专业的软件开发爱好者,不局限某个专业和学历层次,需要一些程序设计的基本概念如计算机求解问题的框架和一些如素数判断这样的基本算法,缺少上述基础的同学不用太担心,在上课过程中可以根据课程自己进度补充一下相关知识并多多 ...
psutil是一个跨平台库(https://github.com/giampaolo/psutil)能够实现获取系统运行的进程和系统利用率(内存,CPU,磁盘,网络等 ...
kcws 深度学习中文分词(Python) BiLSTM+CRF与IDCNN+CRF Genius 中文分词(Python) Genius是一个开源的python中文分词组件,采用 CRF(Conditional Random Field)条件随机场算法。 Information-Extraction-ChineseChinese Named Entity Recognition with ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果