百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

奥鹏_国开24春《电子商务概论》形考作业

lipiwang 2024-10-28 17:24 10 浏览 0 评论

形考任务2
试卷总分:100 得分:100
1.1、下列关于为什么要做数据清理描述错误的是( )
A.数据有重复
B.数据有错误
C.数据有缺失
D.数据量太大
2.2、下列关于数据清理描述错误的是( )
A.数据清理能完全解决数据质量差的问题
B.数据清理在数据分析过程中是不可或缺的一个环节
C.数据清理的目的是提高数据质量
D.可以借助Kettle来完成大量的数据清理工作
3.3、下列关于使用参照表清洗数据说法错误的是( )
A.有些数据无法从内部发现错误,需要结合外部的数据进行参照
B.只要方法得当,数据内部是可以发现错误的,不需要借助参照表
C.使用参数表可以校验数据的准确性
D.使用参照表可以处理数据的一致性
4.4、某店铺2019年度会员信息表中,某会员的出生年份是1990年,但年龄却记录为25岁,此类错误需要进行( )。
A.缺失值清洗
B.重复值清洗
C.逻辑值清洗
D.无价值数据清洗
5.5、关于数据清洗的作用,下列说法正确的是( )。
A.去重、补漏、计算
B.去重、补漏、纠错
C.补漏、纠错、计算
D.去重、计算、纠错
6.6、数据清洗时,运营数据中出现“下单时间2088-12-12”,属于( )。
A.缺失值清洗
B.格式内容清洗
C.逻辑错误清洗
D.重复数据清洗
7.7、以下说法错误的是( )
A.数据预处理的主要流程为数据清理、数据集成、数据变换与数据归约
B.数据清理、数据集成、数据变换、数据归约这些步骤在数据预处理活动中必须顺序使用
C.冗余数据的删除既是一种数据清理形式,也是一种数据归约
D.整个预处理过程要尽量人机结合,尤其要注重和客户以及专家多交流
8.8、处理噪声的方法一般有( )
A.分箱
B.回归
C.聚类
D.以上都是
9.9、数据集成的过程中需要处理的问题有( )
A.实体识别
B.冗余与相关性分析。
C.数据冲突和检测
D.以上都是
10.10、数据归约的方法有( )
A.维度归约
B.数量归约
C.数据压缩
D.以上都是
11.11、关于数据重塑的说法中,下列选项描述错误的是()。
A.数据重塑可以将DataFrame转换为Series
B.stack()方法可以将列索引转换为行索引
C.对一个DataFrame使用stack()方法后返回的一定是一个Series
D..unstack()方法可以将行索引转换为列索引
12.12.请阅读下面的程序: 执行上述程序后,最终输出的结果为()。
A.0 False1 False2 True
B..0 True1 True2 False
C..0 False1 False2 False
D..0 True1 True2 True
13.13、下列选项中,关于drop_duplicates()方法描述错误的是()。
A.仅支持单一特征数据的去重
B..仅对Series和DataFrame对象有效
C.数据去重时默认保留第一个数据
D.该方法不会改变原始数据排列
14.14、下列选项中,关于dropna()方法描述正确的是()。
A.dropna()方法只会删除值为NaN的数据
B.dropna()方法不会删除值为None的数据
C.dropna()方法会删除值为None和NaN的数据
D.dropna()方法只会检测缺失数据和空值
15.15、下列选项中,关于duplicated()方法描述正确的是()。
A.duplicate()方法用于删除重复值
B.duplicate()方法用于标记重复值
C.duplicate()方法会改变原始数据
D.duplicate()方法会将重复的数据标记为False
16.16、下列选项中,属于数据处理的目的是()
A.使数据更加适用于分析
B.对无意义的数据进行清洗
C.整合数据
D.以上全部
17.17、数据清洗的主要内容包括( )。
A.缺失值清洗
B.格式内容清洗
C.逻辑错误清洗
D.以上全部
18.18、在数据表里,缺失值常见的表现形式是( )。
A.空值
B.错误标识符
C.#DIV/0!
D.1
19.19、数据清洗时,处理缺失值的方法不包括( )。
A.删除单元格
B.删除记录
C.数据补齐
D.不处理
20.20、数据逻辑错误不包括( )。
A.数据不合理
B.数据自相矛盾
C.数据不符合规则
D.数据格式错误
21.21、下列选项中,关于数据预处理说法正确的是()。
A.数据清洗包含了数据标准化、数据合并和缺失值处理
B.数据合并按照合并轴的方向主要分为左连接、右连接、内连接和外连接
C.数据分析的预处理过程包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系
D.数据标准化的主要对象是类别型特征
22.22、检测出异常值之后,通常会采用哪些方式处理它们?()
A.直接将含有异常值的记录删除
B.用具体的值来进行替换,可用前后两个观测值的平均值修正该异常值
C.不处理,直接在具有异常值的数据集上进行统计分析
D.以上全部
23.23、下列函数中,可以对数据进行的合并的是()。
A.concat()
B..join()
C..merge()
D.以上全部
24.24、下列方法中,可以修改数据类型的是()。
A.desc()
B.to_numberic()
C.dim()
D.type()
25.25、下列关于重复值处理的说法中,错误的是()。
A.duplicated()方法可以标记重复数据
B.drop_duplicates()方法用于删除重复数据
C.重复数据的判断标准是两个数据中所有条目的值都相等
D.duplicated()方法支持从前向后和从后向前两种查找模式
26.二、判断题
1、数据预处理是数据挖掘中必不可少的关键一步,更是进行数据挖掘前的准备工作。它一方面保论文作业答案请联系 : 证挖掘数据的正确性和有效性,另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。
27.2、重复数据会影响数据处理结果的正确性,从而导致数据分析出现偏差,因此需要将其删除。
28.3、具有多层索引的DataFrame对象经过stack()重塑后,返回的是一个Series对象。
29.4、使用merge()函数进行数据合并时,不需要指定合并键。
30.5、fillna()方法处理缺失数据时可以使用Series对象填充,但不可以使用DataFrame对象填充。
31.6、dropna()方法可以删除数据中所有的缺失值。
32.7、drop_duplicated()方法可以删除重复值。
33.8、rename()方法可以重命名索引名。
34.9、通过merge()函数合并数据时可以指定多个键。
35.10、join()方法可以使用左连接和右连接两种方式连接数据。
36.11、关于Pandas中的数据重塑,stack()方法可以将列索引转换为行索引。
37.12、关于预处理中的数据合并,concat()函数是最常用的主键合并函数,可以通过内连接和外连接的方式堆叠合并数据。
38.13、关于预处理中的数据合并,merge()函数是最常用的主键合并的函数,但不能够通过左连接和右连接的方式合并数据。
39.14、关于预处理中的数据合并,join()方法是最常用的主键合并方法之一,但不能够通过左连接和右连接的方式合并数据。
40.15、Pandas中可以使用boxplot()方法绘制箱形图,以实现对数据中的异常值进行检测。
41.16、关于空值和缺失值,NaN和None是完全一样的。
42.17、notnull()与isnull()方法都可以判断数据中是否存在空值或缺失值。
43.18、dropna()方法可以删除空值和缺失值
44.19、异常值处理中可以基于不同字段的均值和标准差求出异常数据分布范围,然后再对异常范围外 的数据做处理,例如填充为均值
45.20、数据处理中,大多数情况下重复值是需要去除的,使用数据框的drop_duplicates方法即可实现。
46.21、随机抽样即随机的抽取样本,可使用数据框的sample实现,并可通过参数n设置指 定抽样数量,或通过frac指定抽样比例。
47.22、字符串和日期的转换,可通过time或datetime库的strptime和strftime实现。
48.23、数据标准化通过将数据按比例缩放,使之落入一个小的特定区间 对象的操作。
49.24、MaxMin方法则是根据原始数据的最大值和最小值做数据处理,它将数据缩 放为特定范围[0,1]内。
50.25、丢弃缺失值是直接将含有NA值的记录丢弃,适用于NA值的记录较少,且整体 样本量较大的情况。

相关推荐

想减少Windows 11内存占用?请取消固定Teams

如果你想要提高Windows11系统的运行速度,那么可以禁用某些默认启用的功能和设置。如果你的Windows11是安装在已经停止支持的设备或者内存容量不高的旧设备,那么应该立即限制或禁用固...

Windows查看端口占用、查看PID对应的进程、并终止进程

Windows下:查看端口占用netstat-ano|findstr"端口号"获取到pid查看PID对应的进程tasklist|findstr"进程ID"...

计算机组成原理(36): 分时之一——进程

建立一个虚拟机VM目标:给每个程序一个自己的虚拟机“VirtualMachine”,程序并不知道其他的虚拟机。1.1进程(Process)为了捕获正在运行的程序,我们创建一个称为“进程(Proce...

window系统如何停止端口被占用的进程(高手版)

如上图1,作为开发人员是不是经常遇到这个问题?(Webserverfailedtostart.Port9527wasalreadyinuse.)当然,如果在你知道确实有某个进程正占...

电脑的文件无法删除咋回事?你需要这款神兵利器

很多朋友用电脑的时候,都遇到过文件无法删除的情况。这往往是由于文件被某个软件、进程所调用所引发的——在Windows中,某个文件如果被使用,这个文件可能就没法进行删除、重命名之类的操作了。想要进一步操...

Windows日志分析(windows 日志文件)

1.Windows日志文件简介1.1Windows日志核心分类1.系统日志系统日志包含由Windows系统组件记录的事件,记录系统进程和设备驱动程序的活动。由它审核的系统事件包括启动失败的设备驱动程...

电脑软件崩溃、闪退不用慌!DJS Tech 教你几招轻松解决

当你正全神贯注用电脑处理重要文件、沉浸在精彩的游戏世界,或是观看喜欢的视频时,软件突然崩溃、闪退,那一刻的烦躁简直难以言喻。别着急,DJSTech作为深耕计算机领域多年的专业团队,为你带来一系列超...

微软Win11推进淘汰控制面板,时间服务器配置迁移至设置应用

IT之家5月29日消息,科技媒体Winaero昨日(5月28日)发布博文,报道称微软在Windows11系统中,继续推进“淘汰控制面板”进程,配置时间服务器地址选项迁移到设置应...

微软 PowerToys更新,可帮你找出 Win11上哪些进程正在占用该文件

IT之家11月3日消息,微软针对Windows11和Windows10的PowerToys已经更新到了最新的0.64.0版本,并上线了一个名为“文件锁匠FileLock...

Windows基础操作 认识任务管理器(windows任务管理器的使用)

Windows基础操作:认识任务管理器任务管理器(TaskManager)是Windows系统中一个功能强大的实用工具,它为用户提供了实时监控系统资源、管理正在运行的程序和服务的能力。掌握任务管理器...

windows——netstat过滤(终止进程)

windows——netstat过滤(终止进程)在Windows操作系统中,使用netstat命令可以查看网络连接的状态。要过滤特定协议或端口的连接,可以使用以下命令:查看所有连接:netstat-...

只要这么做 Windows Defender与第三方就能和平共存啦

无论大家是否喜欢WindowsDefender,伴随着Windows10的不断升级,它已经成为系统的底层必备组件之一。虽然我们有各种各样的方法去关闭它,换用顺手的第三方,但只要更新打补丁,噩梦就来...

Win10如何彻底关闭wsappx进程(win10 wsappx怎么关闭)

win10如何彻底关闭wsappx进程?wsappx进程是什么?wsappx进程是Windows10系统的一部分,这个进程是WindowsStore和微软通用应用程序平台(UWP)的依赖进程。...

Windows环境黑客入侵应急与排查(黑客入侵电脑原理)

1文件分析1.1临时目录排查黑客往往可能将病毒放在临时目录(tmp/temp),或者将病毒相关文件释放到临时目录,因此需要检查临时目录是否存在异常文件。假设系统盘在C盘,则通常情况下的临时目录如下...

Windows 11 24H2 KB5044384出现大面积安装失败、任务管理器0进程等问题

Windows11KB5044384更新由于出现大量错误而无法在Windows1124H2上安装、其中包括一个奇怪的错误,即由于0x800f0922、0x800736b3和0x8...

取消回复欢迎 发表评论: