百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

用直方图和箱线图理解数据 直方图和箱图的异同点

lipiwang 2024-10-28 17:24 8 浏览 0 评论


了解如何从直方图和箱线图中提取信息

理解这些数据并不意味着只得到平均值、中位数和标准差。很多时候,了解数据的可变性、传播或分布是很重要的。直方图和箱线图都有助于提供有关数据集的大量额外信息,有助于理解数据。

直方图

直方图只从数据集中获取一个变量,并显示每次出现的频率。我将使用一个简单的数据集来学习直方图如何帮助理解数据集。我会用python来制作图片。导入数据集:

import pandas as pd
import seaborn as sns 
import matplotlib.pyplot as plt
df = pd.read_csv("Cartwheeldata.csv")
df.head()

此数据集显示Cartweel数据。假设,办公室里的人决定去野餐时参加手推车距离竞赛。上面的数据集显示了结果。让我们了解一下数据。

1.做一个“Age”的柱状图。

sns.distplot(df['Age'], kde =False).set_title("Histogram of age")

从上面的图片可以看出,大多数人都在30岁以下。只有一个人39岁,一个人54岁。

2.查看“CWDistance”的分布

sns.distplot(df["CWDistance"], kde=False).set_title("Histogram of CWDistance")

很漂亮的阶梯。很难说哪个波段的频率最高。

3.有时将两个分布图一起绘制可以很好地理解。在同一图中绘制“Height”和CWDistance”。

sns.distplot(df["Height"], kde=False)
sns.distplot(df["CWDistance"], kde=False).set_title("Histogram of height and score")

从这张照片上看,我们不能说高度和距离之间有关系。

现在看,我们可以从箱线图中提取什么样的信息。

箱线图

方框图显示了数据的分布和更详细的信息。它更清楚地显示了异常值:最大值、最小值、四分位数(Q1)、第三四分位数(Q3)、四分位数范围(IQR)和中值。你可以从IQR中计算出中间的50%。

它还提供了有关数据倾斜度、数据闭合程度和数据分布的信息。

让我们看一些使用Cartwheel数据的例子。

1.画一个“Score”的箱线图。

sns.boxplot(df["Score"])

从这个图片,我们可以说,

  • 分布是正态的
  • 中位数是6
  • 最低分是2分
  • 最高分是8分
  • 第一个四分位数(前25%)是4
  • 第三个四分位数(75%)是8
  • 中间50%的数据范围是4到8。
  • 四分位数的范围是4。

2.在同一个箱线图中绘制两个变量有助于理解其中一个变量如何影响另一个变量。在同一个图中绘制CWDistance和“Glasses”以查看Glasses是否对CWDistance有任何影响。

sns.boxplot(x = df["CWDistance"], y = df["Glasses"])

没有戴眼镜的人的中位数比戴眼镜的人高。不戴眼镜的人的总体范围较低,但IQR值较高。

从上图来看,IQR的范围是72到94。但对于戴眼镜的人来说,CWDistance的总体范围更大,而IQR则在66到90之间,这比不戴眼镜的人要小。

3.对于分别戴眼镜和不戴眼镜的人来说,CWDistance的柱状图可以提供更多的理解。

g = sns.FacetGrid(df, row = "Glasses")
g = g.map(plt.hist, "CWDistance")

从这张照片上看,戴眼镜的人的最大频率是在CWDistance的开始。glasses对CWDistance的影响还需要进一步的研究。建立一个置信区间可能会有帮助。

我希望这篇文章能给你一些关于箱线图和柱状图的附加信息。

更多阅读建议:

  • 置信区间、计算和特征:https://towardsdatascience.com/confidence-interval-calculation-and-characteristics-1a60fd724e1d
  • 人口比例的置信区间和人口比例差异的计算:https://towardsdatascience.com/confidence-intervals-of-population-proportion-and-the-difference-in-python-6ab7faa0f255
  • 均值和均值差的置信区间计算:https://towardsdatascience.com/how-to-calculate-confidence-interval-of-mean-and-the-difference-of-mean-993bfec0c968

相关推荐

想减少Windows 11内存占用?请取消固定Teams

如果你想要提高Windows11系统的运行速度,那么可以禁用某些默认启用的功能和设置。如果你的Windows11是安装在已经停止支持的设备或者内存容量不高的旧设备,那么应该立即限制或禁用固...

Windows查看端口占用、查看PID对应的进程、并终止进程

Windows下:查看端口占用netstat-ano|findstr"端口号"获取到pid查看PID对应的进程tasklist|findstr"进程ID"...

计算机组成原理(36): 分时之一——进程

建立一个虚拟机VM目标:给每个程序一个自己的虚拟机“VirtualMachine”,程序并不知道其他的虚拟机。1.1进程(Process)为了捕获正在运行的程序,我们创建一个称为“进程(Proce...

window系统如何停止端口被占用的进程(高手版)

如上图1,作为开发人员是不是经常遇到这个问题?(Webserverfailedtostart.Port9527wasalreadyinuse.)当然,如果在你知道确实有某个进程正占...

电脑的文件无法删除咋回事?你需要这款神兵利器

很多朋友用电脑的时候,都遇到过文件无法删除的情况。这往往是由于文件被某个软件、进程所调用所引发的——在Windows中,某个文件如果被使用,这个文件可能就没法进行删除、重命名之类的操作了。想要进一步操...

Windows日志分析(windows 日志文件)

1.Windows日志文件简介1.1Windows日志核心分类1.系统日志系统日志包含由Windows系统组件记录的事件,记录系统进程和设备驱动程序的活动。由它审核的系统事件包括启动失败的设备驱动程...

电脑软件崩溃、闪退不用慌!DJS Tech 教你几招轻松解决

当你正全神贯注用电脑处理重要文件、沉浸在精彩的游戏世界,或是观看喜欢的视频时,软件突然崩溃、闪退,那一刻的烦躁简直难以言喻。别着急,DJSTech作为深耕计算机领域多年的专业团队,为你带来一系列超...

微软Win11推进淘汰控制面板,时间服务器配置迁移至设置应用

IT之家5月29日消息,科技媒体Winaero昨日(5月28日)发布博文,报道称微软在Windows11系统中,继续推进“淘汰控制面板”进程,配置时间服务器地址选项迁移到设置应...

微软 PowerToys更新,可帮你找出 Win11上哪些进程正在占用该文件

IT之家11月3日消息,微软针对Windows11和Windows10的PowerToys已经更新到了最新的0.64.0版本,并上线了一个名为“文件锁匠FileLock...

Windows基础操作 认识任务管理器(windows任务管理器的使用)

Windows基础操作:认识任务管理器任务管理器(TaskManager)是Windows系统中一个功能强大的实用工具,它为用户提供了实时监控系统资源、管理正在运行的程序和服务的能力。掌握任务管理器...

windows——netstat过滤(终止进程)

windows——netstat过滤(终止进程)在Windows操作系统中,使用netstat命令可以查看网络连接的状态。要过滤特定协议或端口的连接,可以使用以下命令:查看所有连接:netstat-...

只要这么做 Windows Defender与第三方就能和平共存啦

无论大家是否喜欢WindowsDefender,伴随着Windows10的不断升级,它已经成为系统的底层必备组件之一。虽然我们有各种各样的方法去关闭它,换用顺手的第三方,但只要更新打补丁,噩梦就来...

Win10如何彻底关闭wsappx进程(win10 wsappx怎么关闭)

win10如何彻底关闭wsappx进程?wsappx进程是什么?wsappx进程是Windows10系统的一部分,这个进程是WindowsStore和微软通用应用程序平台(UWP)的依赖进程。...

Windows环境黑客入侵应急与排查(黑客入侵电脑原理)

1文件分析1.1临时目录排查黑客往往可能将病毒放在临时目录(tmp/temp),或者将病毒相关文件释放到临时目录,因此需要检查临时目录是否存在异常文件。假设系统盘在C盘,则通常情况下的临时目录如下...

Windows 11 24H2 KB5044384出现大面积安装失败、任务管理器0进程等问题

Windows11KB5044384更新由于出现大量错误而无法在Windows1124H2上安装、其中包括一个奇怪的错误,即由于0x800f0922、0x800736b3和0x8...

取消回复欢迎 发表评论: