百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

用Seaborn绘制图表 seaborn 画图

lipiwang 2024-10-28 17:24 8 浏览 0 评论

Seaborn是一个功能强大的Python库,用于增强数据可视化。它为Matplotlib提供了大量高级接口。Seaborn可以很好地处理数据帧,而Matplotlib则不行,它可以让你以更简单的方式绘制引人注目的图表。

确保系统中安装了必要的库:

使用conda:

conda install pandas
conda install matplotlib
conda install seaborn

使用pip:

pip install pandas
pip install matplotlib
pip install seaborn

让我们首先导入所需的Python库和数据集。

你可以在这里找到本教程的CSV文件:https://github.com/jendcruz22/Medium-articles/tree/master/Plotting%20charts%20with%20Seaborn

import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns

df = pd.read_csv('Pokemon.csv', index_col = 0, encoding='unicode-escape')
df.head()

在上面的代码中,我们将index_col设置为0,这表示我们将第一列视为索引。

使用seaborn和Pokemon(口袋妖怪)数据集的属性,我们将创建一些非常有趣的可视化效果。我们首先要看的是散点图。

散点图

散点图使用点来表示不同数值变量的值。每个点在水平轴和垂直轴上的位置表示单个数据点的值。它们用于观察变量之间的关系。

在seaborn中制作散点图只需要使用“lmplot”函数。为此,我们将dataframe传递给data参数,然后传入x和y轴的列名。

默认情况下,散点图还显示一条回归线,它是一条最适合数据的直线。

sns.lmplot(x=’Attack’, y=’Defense’, data=df)
plt.show()

在这里你可以看到我们的散点图,它显示了进攻得分与防守得分的比较。

我们的回归线基本上显示了两轴之间的相关性。在这种情况下,它是向上倾斜的。也就是说当进攻得分越来越高,防守得分也会越来越高。要删除回归线,可以将“fitreg”参数设置为false。

此外,我们可以通过设置hue参数来在Pokemon的进化阶段着色。这个色调的参数是非常有用的,因为它允许你用颜色来表达第三维度的信息。

sns.lmplot(x=’Attack’, y=’Defense’, data=df, fit_reg=False, hue=’Stage’)
plt.show()

散点图看起来和之前的一样,除了中间没有回归线,而且每个点的颜色也不同。这些颜色只是显示了每个小精灵的阶段。Stage只是我们之前看到的数据中的另一个属性。

通过这张图,我们可以得出这样的结论:在第一阶段的pokemon(蓝点)通常比在更高阶段的pokemon得分更低。

箱线图

箱线图是常用于显示数据分布的重要图之一。在seaborn中只需要一行代码就可以使用boxplot函数显示箱线图。在本例中,我们将使用除total、stage和legendary属性之外的整个dataframe。

df_copy = df.drop([‘Total’, ‘Stage’, ‘Legendary’], axis=1)
sns.boxplot(data=df_copy)

在这里我们可以看到每个属性都有其各自的箱线图。

箱线图基于5个数字摘要,每个摘要以不同的行显示。中间的线是中值,是数据的中心点。箱线图末端的最底部和最顶部的线是四分位数1和4的中位数,基本上显示了分布的最小值和最大值。中间的另外两条线是四分位数2和3的中位数,它们显示了值与中位数之间的差异。超出此范围的单点表示数据中的异常值。

小提琴图

小提琴图与箱线图相似。小提琴图是箱线图非常有用的替代品。它们通过小提琴的厚度来显示分布,而不只是简要的统计。众所周知,小提琴图在分析和可视化数据集中不同属性的分布时非常方便。

在本例中,我们将使用上一个示例中的相同数据帧副本。

sns.violinplot(data=df_copy)
plt.show()

我们可以观察到口袋妖怪每个属性的值分布。小提琴较厚的区域意味着值的密度更高。小提琴图的中间部分通常比较厚,这意味着那里的值密度很高。我们比较了下一个口袋妖怪的攻击类型。为此,让我们使用相同的小提琴绘图方法。

plt.figure(figsize=(10,6))\sns.violinplot(x='Type 1', y='Attack', data=df)
plt.show()

这个图显示了每个口袋妖怪的主要类型的攻击分数分布。如你所见,“龙”型口袋妖怪的攻击得分最高,但它们也有较高的方差,这意味着它们的攻击分数也非常低。“Ghost”主类型的方差非常低,这意味着它们的大多数数据值都集中在中心。

热图

热图帮助你可视化矩阵类型的数据。例如,我们可以将口袋妖怪不同属性之间的所有关联可视化。

让我们通过调用“corr”函数来计算数据帧的相关性,并使用“heatmap”函数绘制热图。

corr = df_copy.corr()
sns.heatmap(corr)

上面的热图显示了我们数据帧的相关性。

长方体的颜色越浅,这两个属性之间的相关性就越高。例如,血量和口袋妖怪的整体速度之间的相关性非常低。因此,盒子的颜色是深色的。HP和防御速度之间的相关性非常高,因此我们可以在热图中看到一个红色方块。我们可以看到,当一个属性变高时,其他属性也会变高,比如防守速度。

直方图

直方图允许你绘制数值分布图。如果我们要使用matplotlib来创建柱状图,那么与使用seaborn创建柱状图相比,这将需要更多的工作。对于seaborn,只需要一行代码就可以创建。

例如,我们可以创建一个直方图来绘制带有攻击属性的分布。

sns.distplot(df.Attack, color=’blue’)

我们可以看到大多数口袋妖怪都在50-100之间。我们可以看到,攻击值大于100或小于50的口袋妖怪要少得多。

Calplots公司

与条形图类似,calplots允许你可视化每个类别变量的分布。我们可以使用calplot来查看每种主要类型中有多少口袋妖怪。

sns.countplot(x=’Type 1', data=df)
plt.xticks(rotation=-45)

我们可以看到,“水”类的口袋妖怪最多,而“仙女”和“冰”类的口袋妖怪最少。

密度图

密度图显示两个变量之间的分布。例如,我们可以使用密度图来比较口袋妖怪的两个属性:攻击值、防御值。我们将使用'jointplot'函数来完成此操作。

sns.jointplot(df.Attack, df.Defense, kind=’kde’, color=’lightblue’)

“kde”表示我们需要一个密度图。

如你所见,绘图区域在黑暗中的变化取决于区域中的值的数量。黑暗区域预示着一种非常牢固的关系。从这个图中我们可以看出,当攻击值在50到75之间时,防御值在50左右。

关于这篇文章。我希望你喜欢用seaborn可视化数据。

你可以在这里找到本文的代码和数据集:https://github.com/jendcruz22/Medium-articles/tree/master/Plotting%20charts%20with%20Seaborn

相关推荐

想减少Windows 11内存占用?请取消固定Teams

如果你想要提高Windows11系统的运行速度,那么可以禁用某些默认启用的功能和设置。如果你的Windows11是安装在已经停止支持的设备或者内存容量不高的旧设备,那么应该立即限制或禁用固...

Windows查看端口占用、查看PID对应的进程、并终止进程

Windows下:查看端口占用netstat-ano|findstr"端口号"获取到pid查看PID对应的进程tasklist|findstr"进程ID"...

计算机组成原理(36): 分时之一——进程

建立一个虚拟机VM目标:给每个程序一个自己的虚拟机“VirtualMachine”,程序并不知道其他的虚拟机。1.1进程(Process)为了捕获正在运行的程序,我们创建一个称为“进程(Proce...

window系统如何停止端口被占用的进程(高手版)

如上图1,作为开发人员是不是经常遇到这个问题?(Webserverfailedtostart.Port9527wasalreadyinuse.)当然,如果在你知道确实有某个进程正占...

电脑的文件无法删除咋回事?你需要这款神兵利器

很多朋友用电脑的时候,都遇到过文件无法删除的情况。这往往是由于文件被某个软件、进程所调用所引发的——在Windows中,某个文件如果被使用,这个文件可能就没法进行删除、重命名之类的操作了。想要进一步操...

Windows日志分析(windows 日志文件)

1.Windows日志文件简介1.1Windows日志核心分类1.系统日志系统日志包含由Windows系统组件记录的事件,记录系统进程和设备驱动程序的活动。由它审核的系统事件包括启动失败的设备驱动程...

电脑软件崩溃、闪退不用慌!DJS Tech 教你几招轻松解决

当你正全神贯注用电脑处理重要文件、沉浸在精彩的游戏世界,或是观看喜欢的视频时,软件突然崩溃、闪退,那一刻的烦躁简直难以言喻。别着急,DJSTech作为深耕计算机领域多年的专业团队,为你带来一系列超...

微软Win11推进淘汰控制面板,时间服务器配置迁移至设置应用

IT之家5月29日消息,科技媒体Winaero昨日(5月28日)发布博文,报道称微软在Windows11系统中,继续推进“淘汰控制面板”进程,配置时间服务器地址选项迁移到设置应...

微软 PowerToys更新,可帮你找出 Win11上哪些进程正在占用该文件

IT之家11月3日消息,微软针对Windows11和Windows10的PowerToys已经更新到了最新的0.64.0版本,并上线了一个名为“文件锁匠FileLock...

Windows基础操作 认识任务管理器(windows任务管理器的使用)

Windows基础操作:认识任务管理器任务管理器(TaskManager)是Windows系统中一个功能强大的实用工具,它为用户提供了实时监控系统资源、管理正在运行的程序和服务的能力。掌握任务管理器...

windows——netstat过滤(终止进程)

windows——netstat过滤(终止进程)在Windows操作系统中,使用netstat命令可以查看网络连接的状态。要过滤特定协议或端口的连接,可以使用以下命令:查看所有连接:netstat-...

只要这么做 Windows Defender与第三方就能和平共存啦

无论大家是否喜欢WindowsDefender,伴随着Windows10的不断升级,它已经成为系统的底层必备组件之一。虽然我们有各种各样的方法去关闭它,换用顺手的第三方,但只要更新打补丁,噩梦就来...

Win10如何彻底关闭wsappx进程(win10 wsappx怎么关闭)

win10如何彻底关闭wsappx进程?wsappx进程是什么?wsappx进程是Windows10系统的一部分,这个进程是WindowsStore和微软通用应用程序平台(UWP)的依赖进程。...

Windows环境黑客入侵应急与排查(黑客入侵电脑原理)

1文件分析1.1临时目录排查黑客往往可能将病毒放在临时目录(tmp/temp),或者将病毒相关文件释放到临时目录,因此需要检查临时目录是否存在异常文件。假设系统盘在C盘,则通常情况下的临时目录如下...

Windows 11 24H2 KB5044384出现大面积安装失败、任务管理器0进程等问题

Windows11KB5044384更新由于出现大量错误而无法在Windows1124H2上安装、其中包括一个奇怪的错误,即由于0x800f0922、0x800736b3和0x8...

取消回复欢迎 发表评论: