本研究面向微博评论的情感分析任务,设计并实现了一个基于深度学习的文本情感分析系统。我们选取公开数据集 weibo_senti_100k 作为实验数据源,并针对其中的积极与消极情感进行二分类任务。

项目信息

编号:PDL-5
大小:752M

运行条件

Python开发环境:
– PyCharm的安装包:PyCharm: Python IDE for Professional Developers
– PyCharm的历史安装包:PyCharm: Python IDE for Professional Developers
– Anaconda的安装包:Anaconda | Start Coding Immediately
– Python开发版本:Python==3.9

需要安装依赖包:
– pip install flask== 5.15.11
– pip install transformers==4.38.1
– pip install torch==2.4.0

项目介绍

本研究面向微博评论的情感分析任务,设计并实现了一个基于深度学习的文本情感分析系统。我们选取公开数据集 weibo_senti_100k 作为实验数据源,并针对其中的积极与消极情感进行二分类任务。在数据预处理阶段,通过对微博文本进行清洗和分词,将文本映射为 input_ids 与 attention_mask 等输入特征;随后结合 BERT 预训练模型的强大文本表示能力和 LSTM 网络的时序特征提取,对文本进行更深层次的语义分析。

实验结果表明,模型在测试集上取得了约 98% 的 F1 值,准确率、召回率与 F1 值均达到较高水平,能够有效区分积极和消极情感。进一步的混淆矩阵分析与可视化结果也表明,该模型对于微博文本具有良好的情感分类性能,具有一定的通用性和实用价值。

项目文档

Tipps:提供专业的项目文档撰写服务,覆盖技术类、科研类等多种文档需求。我们致力于帮助客户精准表达项目目标、方法和成果,提升文档的专业性和说服力。
– 点击查看:写作流程
1.撰写内容

2.撰写流程

3.撰写优势

4.适用人群

期待与您的沟通!我们致力于为您提供专业、高效的项目文档撰写服务,无论是通过QQ、邮箱,还是微信,您都能快速找到我们。专业团队随时待命,为您的需求提供最优解决方案。立即联系,开启合作新篇章!

算法流程

Tipps:深入解析项目的算法流程,逐步探索技术实现的核心逻辑。从数据加载与预处理开始,到核心算法的设计与优化,再到结果的可视化呈现,每一步都将以清晰的结构和简洁的语言展现,揭示技术背后的原理与实现思路。

代码讲解

Tipps:我们致力于为您提供全面的项目代码解析服务,深入剖析核心实现、关键逻辑及优化策略,帮助您快速理解项目运行机制。同时,针对您在使用项目中可能遇到的难点,我们提供高效的后续答疑支持,确保问题得到及时、专业的解决。
无论您是初学者还是经验丰富的开发者,我们都能为您量身定制指导方案,助您从掌握到精通。如果您有任何需求或疑问,欢迎随时与我们联系!

1.服务优势

2.联系方式

欢迎随时联系我们!我们将竭诚为您提供高效、专业的技术支持,量身定制解决方案,助您轻松应对技术挑战。

数据说明

Tipps:实验数据来源及评价指标

本文将社交媒体平台微博数据集weibo_senti_100k作为实验数据集,每条评论都经过人工标注,标签由情感极性积极、消极构成。文件大小18.79MB,共计评论119987条数据,其中,积极、消极评论各5万条左右。数据集按照0.65:0.35的比例划分训练集和测试集,其具体内容如图所示,(数据集网址为:https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/weibo_senti_100k)

标注文件csv主要分为两个索引,分别为label、review两列。第一列表示为标签,0表示消极,1表示积极。第二列表示评论文本。

运行效果

运行 app.py
1.主界面

(1)用户输入文本后,点击“提交”按钮即可得到模型对该文本的情感预测结果。
(2)界面简洁明了,输入框与返回结果区分清晰。

2.情感分析结果-积极

当用户输入积极情绪相关文本(如“在社交和人际交往中,积极的态度…能带来更多信任”),系统返回“积极”

2.情感分析结果-消极

当用户输入消极情绪相关文本(如“当一个人长期处于消极的心理状态中…”),系统返回“消极”。

运行 main.py

从截图中的训练日志可见,模型在训练时进行了 3 个 epoch,主要输出了以下关键信息:

训练过程
epoch 1:
(1)损失值(loss)逐渐降低
(2)精确率(precision)、召回率(recall)和 F1 分数(f1-score)达到 0.97 左右
epoch 2:
(1)模型进一步收敛,f1-score 提升至 0.97 以上
epoch 3:
(1)训练完成时,f1-score 接近 0.978,且 precision、recall、f1-score 在两个类别(积极/消极)上都较高

分类报告
(1)precision:表示预测为该类中真正为该类的比例,模型达到了 0.97+
(2)recall:表示真实为该类的样本中被正确预测为该类的比例,也保持在 0.97+
(3)f1-score:综合精确率和召回率,最终可达 0.9779 左右
(4)support:各类别样本量,积极、消极两类数据量接近,训练相对均衡

综合来看,模型在两类情感上都取得了高精确率、高召回率和高 F1 值,说明该模型对积极与消极评论均能有效区分。

实验结果分析
训练效果
(1)损失值随着训练步数下降并趋于平稳,说明模型已成功收敛
(2)各类指标在多轮训练后逐步提高,模型对训练集的特征学习充分

预测表现
(1)测试阶段:当输入文本带有明显积极倾向时,模型返回“积极”;当文本含有负面、消极倾向时,模型返回“消极”
(2)由于 precision、recall、f1-score 均在 0.97~0.98 之间,说明模型漏判和误判都相对较少

系统实用性
(1)前端简洁的输入/输出界面,易于用户在实际场景下测试不同文本的情感倾向
(2)模型在中文文本情感分析任务上有较高的准确率和泛化能力

远程部署

Tipps:购买后可免费协助安装,确保运行成功。
– 远程工具:Todesk向日葵远程控制软件
– 操作系统:Windows OS

项目文件

文件目录

Tipps:完整项目文件清单如下:

通过这些完整的项目文件,不仅可以直观了解项目的运行效果,还能轻松复现,全面展现项目的专业性与实用价值!

声明:本站所有项目资源都可以正常运行,亲测无错!而且我们录制了演示视频,在我们注明的环境版本下,项目运行效果完全和演示视频一致。客服QQ:下载须知