[极简统计学]-01 整理数据的基础知识

2022/8/2 6:24:10

本文主要是介绍[极简统计学]-01 整理数据的基础知识,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

前言

统计就是将收集到的数据进行整理并加以分析的学问

图表的选择应和想呈现的数据内容相匹配

平均数

=总数/个数

除法的两种意义:

  • 将一个整体平分:等分除
  • 将整体平均分成数个等份:包含除

比例

=比较量/基准量

将不同单位的比例思考为等分除

图表

柱状图:表示大小
折线图:表示变化

图表绘制者可以改变读者对于数据变化程度的印象

  • 通过调整纵轴区间大小改变读者对于数据的认识

  • 拉长横轴间隔会使数据看起来更平缓

  • 将变动较大的数据单独提出,以显示巨大的位置变化

饼图:表示比例

表示在一个整体中每个项目各占多少比例

带状图:比较比例

若整体数值不同,则无法从占比的增减来判断绝对数值的增减

数据与变量

实质性数据:也称为“分类数据”,无法用数字来衡量的变量所组成的数据,如血型、食物

量化数据:做加减运算有意义的数据

  • 离散型数据:两相邻项之间没有可取的数据
  • 连续型数据:可以取连续数值的数据,如身高、体重、时间等
整理数据的步骤:
1-整理频数分布表
2-制作矩形图

矩形图

  • 做图时,在最开始的组之前和最后组之后各空出一组的距离,为了让最大值和最小值看起来更加明了
  • 一般来说,矩形图中相邻的两组数柱之间没有空格

代表值

  • 平均值
  • 中位数
    • 数据存在偏离(存在较大或较小的数),适合使用中位数作为数据的代表值
  • 众数

研究数据的离散型

方差

标准差

最大值和最小值

四分位数:第一四分位数、第二四分位数(中位数)、第三四分位数

箱型图

五大要数:最大值、最小值、第一四分位数、第二四分位数(中位数)、第三四分位数

箱型图切分后的区间长度均匀,则数据的离散性是均匀的

矩形图中显示频数高的部分,在箱型图中的长度则比较短



这篇关于[极简统计学]-01 整理数据的基础知识的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程