PYTHON-jieba包在实战中的运用
前言
本文大体可以分为两个部分:微信聊天记录导出和微信聊天记录分析。
微信聊天记录导出:这里我们通过最近github很火的一个项目WeChatMsg,中文名留痕,现已经更新到v1.0.2,使用此工具可以很方便的帮助我们导出我们需要的聊天记录,支持TXT、html等格式。
微信聊天记录分析:使用python的jieba包来拆分统计。
参考文档:
1 | https://sspai.com/post/82577#! |
一、微信聊天记录导出工具使用说明
如果出现闪退问题,请右击使用管理员权限运行
微信务必升级到最新版:3.9.8.15或3.9.8.25
解决不了可发起issue询问,附上报错截图和详细错误情况避免无效询问
手机端使用聊天记录迁移功能将聊天数据迁移到电脑上
操作步骤:
直接替换旧版本即可,不用重新解密(获取最新数据请重启微信之后重新解密)
该软件不存在任何收费,请避免上当受骗
阿里云盘下载地址:https://www.alipan.com/s/h6fDSP4igcz
百度网盘下载地址:链接:https://pan.baidu.com/s/1Bc7Nnnn4yychMPVFDDAsKA?pwd=ez1k 提取码:ez1k
TODO:补充程序安装过程,以及聊天记录导出过程,或许可以直接引用他人的教程?
二、配置python环境,安装jieba等包
接下来将会大量使用 Python 来实现绘制词云,绘制表格,生成 Excel 等功能,所以为了避免缺少各种库而导致报错,可以提前将环境都准备,使用如下命令安装所有依赖库:
1 | pip3 install wordcloud matplotlib pandas jieba mplfonts imageio openpyxl numpy |
使用jieba包将导出来的txt文本中的句子拆分,并剔除一些无意义的词语。
代码:
1 |
- 本文作者: IYUYI
- 本文链接: https://iyuyi.github.io/2024/01/09/PYTHON-jieba包在实战中的运用/
- 版权声明: IYUYI. All rights reserved.