题目为随机抽题 请用CTRL+F来搜索试题
各地区版本不同核对一致后下载。
点击支付下载即可看见答案
形考任务6
考核目的
1.了解词云的制作过程和方法。
2.熟悉过程中用到的 pandas 操作方法。
考核内容
本实验需要对电影评论数据进行分析,这是一类文本型数据,与之前见到的数值型数据 有很大区别。中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础 模块,在进行中文自然语言处理时,通常需要先进行分词。本文选择使用 Python 中的 jieba 模块进行分词,然后导入停用词表,去除停用词(停用词及语句中无意义的词,如”的”,”了” 等)。本实验在接下来的步骤中进行了词频统计,然后利用词云这一直接的方式进行了展现。
考核要求
1.准备格式化数据。
2.通过案例掌握 Pandas 进行文本数据处理以及词云的可视化展现方法。
实验报告要求
1.实验报告由实验目标、实验环境、实验内容、实验结果、实验体会五个方面构成。实验结果为实现代码和生成的页面截图。
2.实验报告以平台允许的格式上传。
3.实验报告由辅导教师评阅。
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。