详细数据分析步骤(三)——可视化分析
lipiwang 2024-10-28 17:25 8 浏览 0 评论
之前的文章讲述的均为数据的前期处理,然而如今对于数据分析而言,数据的可视化也十分重要。所以这篇文章主要想介绍5 种常用可视化图表该怎么用和介绍数据透视表
第一部分 5 种常用可视化图表
在进行绘制之前,需要先引入python的两个第三方库
import matplotlib.pyplot as plt
import seaborn as sns
一.条形图
条形图 (Bar Chart) 也称为「棒形图」或「柱形图」,采用水平或垂直条形(柱形图)来比较不同类别的离散数值。图表其中一条轴代表要比较的具体类别,另一条则用作离散数值的标尺。条形图的离散数据是分类数据,针对的是单一类别中的数量多少,而不会显示数值在某时间段内的持续发展。
ptyhon绘图函数:sns.countplot()/plt.bar()
二.饼图
饼形图 (Pie Chart) 把一个圆圈划分成不同比例的分段,以展示各个类别之间的比例。饼形图适合用来快速展示数据比例分布,但主要缺点是:不能显示太多项目、通常需要图例说明、不能准确比较。
python绘图函数:plt.pie(数据集.value_counts(normalize = True))
三.箱型图
箱形图又称为「盒须图」或「箱线图」,能方便显示数字数据组的四分位数,可以垂直或水平的形式出现。从盒子两端延伸出来的线条称为「晶须」(whiskers),用来表示上、下四分位数以外的变量。异常值 (Outliers) 有时会以与晶须处于同一水平的单一数据点表示。箱形图通常用于描述性统计,是以图形方式快速查看一个或多个数据集的好方法。
python绘图函数:sns.boxplot(x/y = 数据,saturation = 0.75,whis = 1.5)
其中saturation是指箱型的边界,whis是指上界为四分位间距的几倍,系统默认为1.5
四.折线图
折线图用于在连续间隔或时间跨度上显示定量数值,最常用来显示趋势和关系。此外,折线图也能给出某时间段内的「整体概览」,看看数据在这段时间内的发展情况。
python绘图函数:sns.pointplot(横轴= ,纵轴= ,数据)
五.直方图和分布曲线
直方图适合用来显示在连续间隔或特定时间段内的数据分布,有助于估计数值集中位置、上下限值以及确定是否存在差距或异常值;也可粗略显示概率分布。
分布曲线,用于显示数据在连续时间段内的分布状况。这种图表是直方图的变种,使用平滑曲线来绘制数值水平,从而得出更平滑的分布,并且它们不受所使用分组数量的影响,所以能更好地界定分布形状 。
python绘图函数::sns.distplot(数据,bins = ,kde = False/hist = False)
其中,kde决定分布曲线是否绘制,hist决定直方图是否绘制。系统默认两者均为True,即都绘制
第二部分 数据透视表
数据透视表是分类、汇总、计算数据的强大工具,可以将分散的数据明细进行汇总处理,因而在数据分析入门阶段要求熟练掌握。作为统计学专业的学生,在大学刚开始时老师就向我们强调了数据透视表的作用之强大与使用之便利。最常用于数据透视表制作的工具莫过于excel
- 什么情况下适合运用数据透视表?
1、有大量的数据,使用函数计算慢、繁琐
2、希望快速制作、整理、分析各类报表
3、数据源经常发生变化,并且要经常分析和处理最新的数据
4、想快速洞察数据背后隐藏的意义
- 前期数据整理
规范的源数据是数据透视表的核心基础。只有源数据符合一定的规则,数据透视表才能发挥其强大的功能。一个符合标准的源数据应具备以下 4 个特点:
1)源数据包含标题行。
2)同一类数据,放置在一列。
3)源数据中,按标准数据类型存储数据。
4)同一列内数据类型要求相同。
数据透视表的威力虽然无比强大,但使用前提是数据源要规范,否则会给后期创建和使用数据透视表带来层层阻碍,甚至无法创建数据透视表。因此数据透视表创建之前,要先做好前期数据整理。以下是经常会出现的数据规范错误:
1、包含空字段 :若有含空字段,将无法制作数据透视表
2、包含相同字段 :对于相同的字段名,excel会自动添加序号,以示区别
3、有合并单元格 :字段所在行有合并单元格,等同于空字段,也无法创建数据透视表
4、有空行:如果有空行,会当成空值处理
5、包含有文本型数字:文本型数字会导致汇总求和时报错
具体如何用excel制作数据透视表就不赘述了,网上有很多教程
推荐阅读: 数据透视表,一篇就够了 - 知乎
下面介绍python用于制作数据透视表的函数:
pivot_table(data, values=None, index=None, columns=None,aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')
推荐阅读:Python中pandas透视表pivot_table功能详解(非常简单易懂) - The-Chosen-One - 博客园
相关推荐
- 想减少Windows 11内存占用?请取消固定Teams
-
如果你想要提高Windows11系统的运行速度,那么可以禁用某些默认启用的功能和设置。如果你的Windows11是安装在已经停止支持的设备或者内存容量不高的旧设备,那么应该立即限制或禁用固...
- Windows查看端口占用、查看PID对应的进程、并终止进程
-
Windows下:查看端口占用netstat-ano|findstr"端口号"获取到pid查看PID对应的进程tasklist|findstr"进程ID"...
- 计算机组成原理(36): 分时之一——进程
-
建立一个虚拟机VM目标:给每个程序一个自己的虚拟机“VirtualMachine”,程序并不知道其他的虚拟机。1.1进程(Process)为了捕获正在运行的程序,我们创建一个称为“进程(Proce...
- window系统如何停止端口被占用的进程(高手版)
-
如上图1,作为开发人员是不是经常遇到这个问题?(Webserverfailedtostart.Port9527wasalreadyinuse.)当然,如果在你知道确实有某个进程正占...
- 电脑的文件无法删除咋回事?你需要这款神兵利器
-
很多朋友用电脑的时候,都遇到过文件无法删除的情况。这往往是由于文件被某个软件、进程所调用所引发的——在Windows中,某个文件如果被使用,这个文件可能就没法进行删除、重命名之类的操作了。想要进一步操...
- Windows日志分析(windows 日志文件)
-
1.Windows日志文件简介1.1Windows日志核心分类1.系统日志系统日志包含由Windows系统组件记录的事件,记录系统进程和设备驱动程序的活动。由它审核的系统事件包括启动失败的设备驱动程...
- 电脑软件崩溃、闪退不用慌!DJS Tech 教你几招轻松解决
-
当你正全神贯注用电脑处理重要文件、沉浸在精彩的游戏世界,或是观看喜欢的视频时,软件突然崩溃、闪退,那一刻的烦躁简直难以言喻。别着急,DJSTech作为深耕计算机领域多年的专业团队,为你带来一系列超...
- 微软Win11推进淘汰控制面板,时间服务器配置迁移至设置应用
-
IT之家5月29日消息,科技媒体Winaero昨日(5月28日)发布博文,报道称微软在Windows11系统中,继续推进“淘汰控制面板”进程,配置时间服务器地址选项迁移到设置应...
- 微软 PowerToys更新,可帮你找出 Win11上哪些进程正在占用该文件
-
IT之家11月3日消息,微软针对Windows11和Windows10的PowerToys已经更新到了最新的0.64.0版本,并上线了一个名为“文件锁匠FileLock...
- Windows基础操作 认识任务管理器(windows任务管理器的使用)
-
Windows基础操作:认识任务管理器任务管理器(TaskManager)是Windows系统中一个功能强大的实用工具,它为用户提供了实时监控系统资源、管理正在运行的程序和服务的能力。掌握任务管理器...
- windows——netstat过滤(终止进程)
-
windows——netstat过滤(终止进程)在Windows操作系统中,使用netstat命令可以查看网络连接的状态。要过滤特定协议或端口的连接,可以使用以下命令:查看所有连接:netstat-...
- 只要这么做 Windows Defender与第三方就能和平共存啦
-
无论大家是否喜欢WindowsDefender,伴随着Windows10的不断升级,它已经成为系统的底层必备组件之一。虽然我们有各种各样的方法去关闭它,换用顺手的第三方,但只要更新打补丁,噩梦就来...
- Win10如何彻底关闭wsappx进程(win10 wsappx怎么关闭)
-
win10如何彻底关闭wsappx进程?wsappx进程是什么?wsappx进程是Windows10系统的一部分,这个进程是WindowsStore和微软通用应用程序平台(UWP)的依赖进程。...
- Windows环境黑客入侵应急与排查(黑客入侵电脑原理)
-
1文件分析1.1临时目录排查黑客往往可能将病毒放在临时目录(tmp/temp),或者将病毒相关文件释放到临时目录,因此需要检查临时目录是否存在异常文件。假设系统盘在C盘,则通常情况下的临时目录如下...
- Windows 11 24H2 KB5044384出现大面积安装失败、任务管理器0进程等问题
-
Windows11KB5044384更新由于出现大量错误而无法在Windows1124H2上安装、其中包括一个奇怪的错误,即由于0x800f0922、0x800736b3和0x8...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)