Python可视化 | Seaborn5分钟入门(三)——boxplot和violinplot
lipiwang 2024-10-28 17:24 9 浏览 0 评论
Seaborn是基于matplotlib的Python可视化库。 它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。
注:所有代码均在IPython notebook中实现
boxplot
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值、最小值、中位数及上下四分位数。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。图解如下:
接下来我们介绍Seaborn中的箱型图的具体实现方法,这是boxplot的API:
seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)
我们从具体的实例出发
%matplotlib inline import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt plt.rc("font",family="SimHei",size="15") #解决中文乱码问题
本文所使用的数据集是鸢尾花卉数据集
data.head(6)
x,y:dataframe中的列名(str)或者矢量数据
data:dataframe或者数组
sns.boxplot(x=data["pw"],data=data)
palette:调色板,控制图像的色调
fig,axes=plt.subplots(1,2,sharey=True) sns.boxplot(x="catagory",y="pw",data=data,ax=axes[0]) #左图 sns.boxplot(x="catagory",y="pw",data=data,palette="Set3",ax=axes[1]) #右图
hue(str):dataframe的列名,按照列名中的值分类形成分类的条形图
sns.boxplot(x="color",y="pl",data=data,hue="catagory",palette="Set3")
order, hue_order (lists of strings):用于控制条形图的顺序
sns.boxplot(x="catagory",y="pw",data=data,palette="Set3",order=[2,1,0])
orient:"v"|"h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)
fig,axes=plt.subplots(2,1) sns.boxplot(data=data,orient="v",palette="Set3",ax=axes[0]) #竖直显示 sns.boxplot(data=data,orient="h",palette="Set3",ax=axes[1]) #水平显示
fliersize:float,用于指示离群值观察的标记大小
fig,axes=plt.subplots(1,2) sns.boxplot(x="color",y="pl",data=data,ax=axes[0]) #fliersize默认为5 sns.boxplot(x="color",y="pl",data=data,fliersize=20,ax=axes[1])
whis:确定离群值的上下界(IQR超过低和高四分位数的比例),此范围之外的点将被识别为异常值。IQR指的是上下四分位的差值。
fig,axes=plt.subplots(1,2) sns.boxplot(x="color",y="pl",data=data,whis=1,ax=axes[0]) #左图 sns.boxplot(x="color",y="pl",data=data,whis=2,ax=axes[1]) #右图
width:float,控制箱型图的宽度
fig,axes=plt.subplots(1,2) sns.boxplot(x="color",y="pl",data=data,width=0.3,ax=axes[0]) #左图 sns.boxplot(x="color",y="pl",data=data,width=0.8,ax=axes[1]) #右图
violinplot
violinplot与boxplot扮演类似的角色,它显示了定量数据在一个(或多个)分类变量的多个层次上的分布,这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点,小提琴绘图以基础分布的核密度估计为特征。具体用法如下:
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100, width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None, color=None, palette=None, saturation=0.75, ax=None, **kwargs)
实例所用的数据集如下:
data.head(6)
在这里就不再介绍x,y,hue,data,order,hue_order,palette参数的用法,这些参数的用法和之前介绍的图形的用法是一样的,如有需要可以查看之前的内容。
先来画一个小提琴图:
sns.violinplot(x="gender",y="age",data=data)
split:将split设置为true则绘制分拆的violinplot以比较经过hue拆分后的两个量:
fig,axes=plt.subplots(2,1) ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,ax=axes[0]) #上图,拆分后的图 ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",ax=axes[1]) #下图
scale_hue:bool,当使用色调变量(hue参数)嵌套小提琴时,此参数确定缩放是在主要分组变量(scale_hue = true)的每个级别内还是在图上的所有小提琴(scale_hue = false)内计算出来的。
fig,axes=plt.subplots(2,1) ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,scale_hue=False,ax=axes[0]) #上图 ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,scale_hue=True,ax=axes[1]) #下图
orient:"v"|"h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)
fig,axes=plt.subplots(2,1) sns.violinplot(data=data[["height","weight","age"]],orient="v",ax=axes[0]) #上图 sns.violinplot(data=data[["height","weight","age"]],orient="h",ax=axes[1]) #下图
inner:控制violinplot内部数据点的表示,有“box”, “quartile”, “point”, “stick”四种方式。
fig,axes=plt.subplots(2,2) #钢琴图内显示箱型图(左上) sns.violinplot(x="color",y="age",data=data,inner="box",ax=axes[0,0]) #钢琴图内显示四分位数线(右上) sns.violinplot(x="color",y="age",data=data,inner="quartile",ax=axes[0,1]) #钢琴图内显示具体数据点(左下) sns.violinplot(x="color",y="age",data=data,inner="point",ax=axes[1,0]) #钢琴图内显示具体数据棒(右下) sns.violinplot(x="color",y="age",data=data,inner="stick",ax=axes[1,1])
scale:该参数用于缩放每把小提琴的宽度,有“area”, “count”, “width”三种方式
fig,axes=plt.subplots(3,1) #如果为"area",每把小提琴将有相同的面积(上图) sns.violinplot(x="color",y="age",data=data,scale="area",ax=axes[0]) #如果为"count",小提琴的宽度将根据该小组中观察的数量来缩放(中图) sns.violinplot(x="color",y="age",data=data,scale="count",ax=axes[1]) #如果为"age",每把小提琴将有相同的宽度(下图) sns.violinplot(x="color",y="age",data=data,scale="width",ax=axes[2])
cut:float,距离,以带宽大小为单位,以控制小提琴图外壳延伸超过内部极端数据点的密度。设置为0以将小提琴范围限制在观察数据的范围内(即,在ggplot中具有与trim = true相同的效果)
fig,axes=plt.subplots(2,1) sns.violinplot(x="age",y="gender",data=data,ax=axes[0]) #上图 sns.violinplot(x="age",y="gender",data=data,cut=0,ax=axes[1]) #下图
width:float,控制钢琴图的宽度(比例)
fig,axes=plt.subplots(2,1) sns.violinplot(x="color",y="age",data=data,ax=axes[0],width=0.5) #上图 sns.violinplot(x="color",y="age",data=data,ax=axes[1],width=0.9) #下图
这已经是Seaborn入门系列的第三篇文章了,相信大家已经大概了解Seaborn的作图过程,也可以体会到用Seaborn作图相比于matplotlib更加简单。以上内容是我结合官方文档和自己的一点理解写成的,有什么错误大家可以指出来并提提意见,共同交流、进步,也希望我写的这些能够给阅读完本文的你或或少的帮助!
相关推荐
- 想减少Windows 11内存占用?请取消固定Teams
-
如果你想要提高Windows11系统的运行速度,那么可以禁用某些默认启用的功能和设置。如果你的Windows11是安装在已经停止支持的设备或者内存容量不高的旧设备,那么应该立即限制或禁用固...
- Windows查看端口占用、查看PID对应的进程、并终止进程
-
Windows下:查看端口占用netstat-ano|findstr"端口号"获取到pid查看PID对应的进程tasklist|findstr"进程ID"...
- 计算机组成原理(36): 分时之一——进程
-
建立一个虚拟机VM目标:给每个程序一个自己的虚拟机“VirtualMachine”,程序并不知道其他的虚拟机。1.1进程(Process)为了捕获正在运行的程序,我们创建一个称为“进程(Proce...
- window系统如何停止端口被占用的进程(高手版)
-
如上图1,作为开发人员是不是经常遇到这个问题?(Webserverfailedtostart.Port9527wasalreadyinuse.)当然,如果在你知道确实有某个进程正占...
- 电脑的文件无法删除咋回事?你需要这款神兵利器
-
很多朋友用电脑的时候,都遇到过文件无法删除的情况。这往往是由于文件被某个软件、进程所调用所引发的——在Windows中,某个文件如果被使用,这个文件可能就没法进行删除、重命名之类的操作了。想要进一步操...
- Windows日志分析(windows 日志文件)
-
1.Windows日志文件简介1.1Windows日志核心分类1.系统日志系统日志包含由Windows系统组件记录的事件,记录系统进程和设备驱动程序的活动。由它审核的系统事件包括启动失败的设备驱动程...
- 电脑软件崩溃、闪退不用慌!DJS Tech 教你几招轻松解决
-
当你正全神贯注用电脑处理重要文件、沉浸在精彩的游戏世界,或是观看喜欢的视频时,软件突然崩溃、闪退,那一刻的烦躁简直难以言喻。别着急,DJSTech作为深耕计算机领域多年的专业团队,为你带来一系列超...
- 微软Win11推进淘汰控制面板,时间服务器配置迁移至设置应用
-
IT之家5月29日消息,科技媒体Winaero昨日(5月28日)发布博文,报道称微软在Windows11系统中,继续推进“淘汰控制面板”进程,配置时间服务器地址选项迁移到设置应...
- 微软 PowerToys更新,可帮你找出 Win11上哪些进程正在占用该文件
-
IT之家11月3日消息,微软针对Windows11和Windows10的PowerToys已经更新到了最新的0.64.0版本,并上线了一个名为“文件锁匠FileLock...
- Windows基础操作 认识任务管理器(windows任务管理器的使用)
-
Windows基础操作:认识任务管理器任务管理器(TaskManager)是Windows系统中一个功能强大的实用工具,它为用户提供了实时监控系统资源、管理正在运行的程序和服务的能力。掌握任务管理器...
- windows——netstat过滤(终止进程)
-
windows——netstat过滤(终止进程)在Windows操作系统中,使用netstat命令可以查看网络连接的状态。要过滤特定协议或端口的连接,可以使用以下命令:查看所有连接:netstat-...
- 只要这么做 Windows Defender与第三方就能和平共存啦
-
无论大家是否喜欢WindowsDefender,伴随着Windows10的不断升级,它已经成为系统的底层必备组件之一。虽然我们有各种各样的方法去关闭它,换用顺手的第三方,但只要更新打补丁,噩梦就来...
- Win10如何彻底关闭wsappx进程(win10 wsappx怎么关闭)
-
win10如何彻底关闭wsappx进程?wsappx进程是什么?wsappx进程是Windows10系统的一部分,这个进程是WindowsStore和微软通用应用程序平台(UWP)的依赖进程。...
- Windows环境黑客入侵应急与排查(黑客入侵电脑原理)
-
1文件分析1.1临时目录排查黑客往往可能将病毒放在临时目录(tmp/temp),或者将病毒相关文件释放到临时目录,因此需要检查临时目录是否存在异常文件。假设系统盘在C盘,则通常情况下的临时目录如下...
- Windows 11 24H2 KB5044384出现大面积安装失败、任务管理器0进程等问题
-
Windows11KB5044384更新由于出现大量错误而无法在Windows1124H2上安装、其中包括一个奇怪的错误,即由于0x800f0922、0x800736b3和0x8...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)