iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >数据分析案例-电影数据可视化分析
  • 182
分享到

数据分析案例-电影数据可视化分析

python数据分析 2023-10-03 09:10:32 182人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

数据介绍 数据为2011-2021电影数据 可视化分析 首先导入本次项目需要的包和数据 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport

数据介绍

数据为2011-2021电影数据

可视化分析

首先导入本次项目需要的包和数据

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom pyecharts.charts import Piefrom pyecharts import options as  opts from pyecharts.globals import ThemeTypesns.set_style('ticks')import warningswarnings.filterwarnings('ignore') # 忽略警告plt.rcParams['font.sans-serif'] = ['SimHei'] #解决中文显示plt.rcParams['axes.unicode_minus'] = False   #解决符号无法显示data = pd.read_excel('data.xlsx')data.head()

数据预处理

data.dropna(inplace=True)data.reset_index(drop=True,inplace=True)data.drop_duplicates(['电影名称'],inplace=True)data['年份'] = data['上映时间'].apply(lambda x:x.split('-')[0])# 将首周票房中的--数据删除data[data['首周票房']=='--'].indexdata.drop(index=data[data['首周票房']=='--'].index,inplace=True)data.reset_index(drop=True,inplace=True)# 将首周票房亿单位转化为万,且只保留数字data['首周票房'] = data['首周票房'].apply(lambda x: float(x[:-1])*1000 if x[-1] == '亿' else float(x[:-1]))# 将累计票房亿单位转化为万,且只保留数字data['累计票房'] = data['累计票房'].apply(lambda x: float(x[:-1])*1000 if x[-1] == '亿' else float(x[:-1]))

 可视化

# 分析各个年份的总票房df1 = data.groupby('年份').sum()['累计票房']plt.figure(figsize=(10,8))plt.title('各个年份的总票房',fontsize=14)plt.xlabel('年份',fontsize=14)plt.ylabel('总票房(万元)',fontsize=14)plt.bar(x=df1.index,height=df1.values)plt.show()

# 分析各个年份的电影比例result_list = [(i,j) for i,j in zip(df1.index.to_list(),df1.values.tolist())]a = Pie(init_opts=opts.InitOpts(theme = ThemeType.DARK))a.add(series_name='年份',        data_pair=result_list,        rosetype='radius',        radius='70%',        )a.set_global_opts(title_opts=opts.TitleOpts(title="各个年份的电影比例",                    pos_top=50))a.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',fORMatter='{a} 
{b}:{c} ({d}%)'))a.render_notebook()

 

# 分析各个年份的平均票价df2 = data.groupby('年份').mean()['平均票价']plt.figure(figsize=(10,8))plt.title('各个年份的平均票价',fontsize=14)plt.xlabel('年份',fontsize=14)plt.ylabel('平均票价(元)',fontsize=14)plt.plot(df2.index,df2.values)plt.show()

 

# 分析电影片长的分布sns.displot(data['片长'],bins=30,kde=True)

# 分析电影平均票价的分布sns.displot(data['平均票价'],kde=True)

 

# 分析导演喜爱度的分布sns.displot(data['导演喜爱度'],kde=True)

 

df3 = data['来源'].apply(lambda x:x.split(',')[0]).value_counts().head()# 各个地区的电影比例a1 = Pie(init_opts=opts.InitOpts(theme = ThemeType.CHALK))a1.add(series_name='地区',        data_pair=[list(z) for z in zip(df3.index.to_list(),df3.values.tolist())],        rosetype='radius',        radius='60%',        )a1.set_global_opts(title_opts=opts.TitleOpts(title="各个地区的电影比例",                    pos_left='center',                    pos_top=30))a1.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} 
{b}:{c} ({d}%)'))a1.render_notebook()

# 分析拍电影数前五的发行公司df4 = data['发行公司'].value_counts().head().plot(kind='barh')

 

# 分析片长和评分的关系plt.figure(figsize=(10,8))plt.scatter(data['片长'],data['评分'])plt.title('片长和评分的关系',fontsize=15)plt.xlabel('片长',fontsize=15)plt.ylabel('评分',fontsize=15)plt.show()

 

# 分析各个特征之间的相关系数fig = plt.figure(figsize=(18,18))sns.heatmap(data.corr(),vmax=1,annot=True,linewidths=0.5,cbar=False,cmap='YlGnBu',annot_kws={'fontsize':25})plt.xticks(fontsize=20)plt.yticks(fontsize=20)plt.title('各个特征之间的相关系数',fontsize=20)plt.show()

# 分析年度总票房走势df1 = data.groupby('年份').sum()['累计票房']plt.figure(figsize=(10,8))plt.title('年度总票房走势',fontsize=14)plt.xlabel('年份',fontsize=14)plt.ylabel('总票房(万元)',fontsize=14)plt.plot(df1.index,df1.values)plt.show()

# 分析哪种制片制式最受欢迎from pyecharts.charts import WordCloudimport collectionsresult_list = []for i in data['制片制式'].values:    word_list = str(i).split('/')    for j in word_list:        result_list.append(j)result_listword_counts = collections.Counter(result_list)word_counts_top = word_counts.most_common(50)print(word_counts_top)wc = WordCloud()wc.add('',word_counts_top)wc.render_notebook()

 

# 分析各种制式制片的比例a2 = Pie(init_opts=opts.InitOpts(theme = ThemeType.CHALK))a2.add(series_name='类型',        data_pair=word_counts_top,        radius='60%',        )a2.set_global_opts(title_opts=opts.TitleOpts(title="各种制式制片的比例",                    pos_top=50))a2.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} 
{b}:{c} ({d}%)'))a2.render_notebook()

 

# 分析各种类型的电影出现的次数from pyecharts.charts import WordCloudimport collectionsresult_list = []for i in data['电影类型'].values:    word_list = str(i).split(' / ')    for j in word_list:        result_list.append(j)result_listword_counts = collections.Counter(result_list)# 词频统计:获取前100最高频的词word_counts_top = word_counts.most_common(100)print(word_counts_top)wc = WordCloud()wc.add('',word_counts_top)wc.render_notebook()

 

# 分析各种类型电影的比例word_counts_top = word_counts.most_common(10)a3 = Pie(init_opts=opts.InitOpts(theme = ThemeType.MacARONS))a3.add(series_name='类型',        data_pair=word_counts_top,        rosetype='radius',        radius='60%',        )a3.set_global_opts(title_opts=opts.TitleOpts(title="各种类型电影的比例",                        pos_left='center',                    pos_top=50))a3.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} 
{b}:{c} ({d}%)'))a3.render_notebook()

以下是心得体会:

通过这次python项目实战,我学到了许多新的知识,这是一个让我把书本上的理论知识运用于实践中的好机会。原先,学的时候感叹学的资料太难懂,此刻想来,有些其实并不难,关键在于理解。

在这次实战中还锻炼了我其他方面的潜力,提高了我的综合素质。首先,它锻炼了我做项目的潜力,提高了独立思考问题、自我动手操作的潜力,在工作的过程中,复习了以前学习过的知识,并掌握了一些应用知识的技巧等

在此次实战中,我还学会了下面几点工作学习心态:

1)继续学习,不断提升理论涵养。在信息时代,学习是不断地汲取新信息,获得事业进步的动力。作为一名青年学子更就应把学习作为持续工作用心性的重要途径。走上工作岗位后,我会用心响应单位号召,结合工作实际,不断学习理论、业务知识和社会知识,用先进的理论武装头脑,用精良的业务知识提升潜力,以广博的社会知识拓展视野。

2)努力实践,自觉进行主角转化。只有将理论付诸于实践才能实现理论自身的价值,也只有将理论付诸于实践才能使理论得以检验。同样,一个人的价值也是透过实践活动来实现的,也只有透过实践才能锻炼人的品质,彰显人的意志。

3)提高工作用心性和主动性。实习,是开端也是结束。展此刻自我面前的是一片任自我驰骋的沃土,也分明感受到了沉甸甸的职责。在今后的工作和生活中,我将继续学习,深入实践,不断提升自我,努力创造业绩,继续创造更多的价值。

这次Python实战不仅仅使我学到了知识,丰富了经验。也帮忙我缩小了实践和理论的差距。在未来的工作中我会把学到的理论知识和实践经验不断的应用到实际工作中,为实现理想而努力。

在这次实战中还锻炼了我其他方面的潜力,提高了我的综合素质。首先,它锻炼了我做项目的潜力,提高了独立思考问题、自我动手操作的潜力,在工作的过程中,复习了以前学习过的知识,并掌握了一些应用知识的技巧等

1)继续学习,不断提升理论涵养。在信息时代,学习是不断地汲取新信息,获得事业进步的动力。作为一名青年学子更就应把学习作为持续工作用心性的重要途径。走上工作岗位后,我会用心响应单位号召,结合工作实际,不断学习理论、业务知识和社会知识,用先进的理论武装头脑,用精良的业务知识提升潜力,以广博的社会知识拓展视野。

2)努力实践,自觉进行主角转化。只有将理论付诸于实践才能实现理论自身的价值,也只有将理论付诸于实践才能使理论得以检验。同样,一个人的价值也是透过实践活动来实现的,也只有透过实践才能锻炼人的品质,彰显人的意志。

3)提高工作用心性和主动性。实习,是开端也是结束。展此刻自我面前的是一片任自我驰骋的沃土,也分明感受到了沉甸甸的职责。在今后的工作和生活中,我将继续学习,深入实践,不断提升自我,努力创造业绩,继续创造更多的价值。

这次Python实战不仅仅使我学到了知识,丰富了经验。也帮忙我缩小了实践和理论的差距。在未来的工作中我会把学到的理论知识和实践经验不断的应用到实际工作中,为实现理想而努力。

来源地址:https://blog.csdn.net/m0_64336780/article/details/125242138

--结束END--

本文标题: 数据分析案例-电影数据可视化分析

本文链接: https://www.lsjlt.com/news/422968.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 数据分析案例-电影数据可视化分析
    数据介绍 数据为2011-2021电影数据 可视化分析 首先导入本次项目需要的包和数据 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport ...
    99+
    2023-10-03
    python 数据分析
  • Python实现数据可视化案例分析
    目录1. 问题描述2. 实验环境3. 实验步骤及结果1. 问题描述 对右图进行修改: 请更换图形的风格请将 x 轴的数据改为-10 到 10请自行构造一个 y 值的函数将直方图上的数...
    99+
    2024-04-02
  • 用Python爬取电影数据并可视化分析
      🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬...
    99+
    2023-08-31
    python 信息可视化 开发语言
  • Python数据可视化举例分析
    这篇文章主要介绍“Python数据可视化举例分析”,在日常操作中,相信很多人在Python数据可视化举例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python数据可视化举例分析”的疑惑有所帮助!接下来...
    99+
    2023-06-16
  • python数据分析绘图可视化实例分析
    本篇内容介绍了“python数据分析绘图可视化实例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前言:数据分析初始阶段,通常都要进行可视...
    99+
    2023-07-02
  • python数据分析及可视化(十五)数据分析可视化实战篇(抖音用户数据分析、二手房数据分析)
    python数据分析的实战篇,围绕实例的数据展开分析,通过数据操作案例来了解数据分析中的频繁用到的知识内容。 抖音用户数据分析 1.理解数据 数据字段含义 了解数据内容,确保数据来源是正常的,安全合法...
    99+
    2023-09-02
    python 数据分析 开发语言
  • Python pyecharts案例超市4年数据可视化分析
    目录一、数据描述1、数据概览二、数据预处理1、导入包和数据2、列名重命名3、提取数据中时间,方便后续分析绘图三、数据可视化1、美国各个地区销售额的分布(地图)2、各产品类别销售额对比...
    99+
    2024-04-02
  • Python数据分析之Matplotlib数据可视化
    目录1.前言2.Matplotlib概念3.Matplotlib.pyplot基本使用3.数据展示3.1如何选择展示方式3.2绘制折线图3.3绘制柱状图3.3.1普通柱状图3.3.2...
    99+
    2024-04-02
  • Python数据分析之绘图和可视化的示例分析
    小编给大家分享一下Python数据分析之绘图和可视化的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!一、前言matplotlib是一个用于创建出版质量图表...
    99+
    2023-06-15
  • python数据分析绘图可视化
    前言: 数据分析初始阶段,通常都要进行可视化处理。数据可视化旨在直观展示信息的分析结果和构思,令某些抽象数据具象化,这些抽象数据包括数据测量单位的性质或数量。本章用的程序库matpl...
    99+
    2024-04-02
  • Python疫情数据可视化分析
    目录前言功能函数读取文件更换列名,便于查看全球疫情趋势筛选出中国的数据利用groupby按照省统计确诊死亡治愈病例的总和确诊人数排名前15的国家这里用pyecharts库画图,绘制的...
    99+
    2024-04-02
  • VUE 数据可视化:提升您的数据分析
    借助 Vue.js 的灵活性,Vue 数据可视化库赋能开发者创建交互式且吸睛的数据图表和仪表盘。通过以下指南,您将探索 Vue 数据可视化的强大功能,从而提升您的数据分析能力。 最常用的 Vue 数据可视化库 Vue-Chart.js...
    99+
    2024-03-06
    Vue、数据可视化、图表、仪表盘、分析
  • Python数据处理及可视化的示例分析
    这篇文章主要介绍Python数据处理及可视化的示例分析,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、NumPy的初步使用表格是数据的一般表示形式,但对于机器来说是不可理解的,也就是无法辨识的数据,所以我们需要对表...
    99+
    2023-06-29
  • Golang在数据分析和可视化的应用示例
    go广泛用于数据分析和可视化。示例包括:基础设施监控:使用go和telegraf、prometheus构建监控应用程序。机器学习:利用go和tensorflow或pytorch构建和训练...
    99+
    2024-05-12
    可视化 数据分析 git golang 可视化数据
  • VUE 数据可视化:数据分析的未来,触手可及
    VUE 的优势 VUE 作为一种现代且流行的 JavaScript 框架,专为构建交互式且复杂的数据可视化界面而设计。其优势包括: 高性能:VUE 采用虚拟 DOM 和增量更新技术,可实现高性能和流畅的交互。 可扩展性:VUE 提供了强...
    99+
    2024-04-02
  • Python数据分析应用之Matplotlib数据可视化详情
    目录简述掌握绘图基础语法与基本参数 掌握pyplot基础语法pyplot中的基础绘图语法包含子图的基础语法调节线条的rc参数调节字体的rc参数分析特征间的关系绘制散点图绘制2000-...
    99+
    2024-04-02
  • python数据可视化自制职位分析生成岗位分析数据报表
    目录前言1. 核心功能设计可视化展示岗位表格数据分析岗位薪资情况分析岗位公司情况数据分析导出2. GUI设计与实现3. 功能实现3.1 职位数据爬虫3.2 数据预处理3.3 岗位数据...
    99+
    2024-04-02
  • python3 对拉勾数据进行可视化分析
      上回说到我们如何如何把拉勾的数据抓取下来的,既然获取了数据,就别放着不动,把它拿出来分析一下,看看这些数据里面都包含了什么信息。(本次博客源码地址:https://github.com/MaxLyu/Lagou_Analyze) 一、...
    99+
    2023-01-31
    数据
  • Python爬取天气数据及可视化分析
    正文 大家好,我是Python人工智能技术天气预报我们每天都会关注,我们可以根据未来的天气增减衣物、安排出行,每天的气温、风速风向、相对湿度、空气质量等成为关注的焦点。得到温湿度度变化曲线、空气质量图、风向雷达图等结果,为获得未来天气信息提...
    99+
    2023-05-14
    Python 天气数据 可视化分析
  • python可视化数据分析pyecharts初步尝试
    目录整体说明例子BoxplotBarHeatMap有一个web+flask项目需要可视化数据分析结果,检索后发现,pyecharts工具包非常对口。 Echarts 是一个由百度开源...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作