如何分析卡车生产数据?
Posted: Thu Jan 16, 2025 5:57 am
为了分析一些汽车市场数据,我不得不进行一些挖掘。如果你像我一样,更喜欢分析数据而不是幻想新闻,那么你必须有工作。在这个阳光明媚的周日,整整花了 44 分钟才找到可以访问的数据源。
我的第一个搜索源是 FENABRAVE 网站,但在那里,我只找到了每月比较的 pdf 文件。你知道那件事不会通向任何地方吗?将某个月与另一个月或今年与去年的一段时间进行比较?是的,亲爱的床。人们撕毁了戴明深层知识中的“理解变异” ,而不断地比较正常原因的变异。
经过这次搜索,我到达了 ANFAVEA 网站,在那里我找到了一个很好的基地。网站上有一个历史系列的链接,可以在 Excel 中快速下载。找到这样的地方是多么好的事情,其数据是由那些理解的人构建的。但让我们进入正题吧?让我们继续分析巴西的汽车市场。
卡车销售情况如何?
为了开始分析,我建议我们先了解一下基础知识。那么,分 黎巴嫩数据 析时间序列的基本图表是什么?著名的趋势图(或线),或者顾名思义:Times Series Plot。在图 1 中,我们显示了巴西卡车产量和国家卡车许可数量的趋势图。
卡车生产
图 1:全国卡车产量和许可趋势图。
从图1中,通过这个简单的图表,你可以看到,从2012年到现在,市场的跌幅一直很强劲。很明显,生产符合许可,也就是说,该行业似乎遵循国内市场。即使销量急剧下降,出口仍然不足以保持我们的生产强劲。
如何制作数据分析控制图?
如果你是我们学校毕业的绿带或黑带,我敢打赌,当你读到这个新闻时,你的脑子里已经在说话了:控制图,控制图……冷静下来。我们开始做吧。但问题来了:使用哪个图表?
变量的类型是什么?
物品的产量是连续变量、计数变量还是分类变量?由于我们无法生产半辆卡车,因此我们说产量是一个离散变量,因此我们将其分类为计数。正确的?不。生产不是属性变量,因为我不想计算总体中的缺陷或问题。因此,为了分析卡车生产,我必须使用变量控制图。
但是,您还记得,使用变量控制图(X-bar R、X-bar s、I 和 MR 或 CUSUM)时必须做出的假设是分布是正态的。但这种分布真的正常吗?为了检查特征的个体或平均结果的正态性,可以应用多种技术,例如使用直方图、坚持性检验(Anderson-Darling、Kolmogorov-Smirnov 或 Shapiro-Wilk)或概率图(QQ 图或图表)纸)。
我们已经在博客上讨论过使用 Minitab 软件进行正态性检验的程序。但在这里,为了测试正态性,我们将使用概率图。
卡车生产
图 2:卡车生产概率图。
从图 2 可以看出,分布不是正态的。而且,如果我们稍微思考一下,就会发现这是有道理的,不是吗?我们不能指望从我父亲出生那年(1957年)至今,卡车的月产量会呈正态分布。产量持续 60 年停滞不前,意味着我们卡车运输物品的产量在此期间没有增长。鉴于这种情况,该怎么办?Box-Cox 变换?我不知道,我们来测试一下。
如何对待非正态分布?
卡车生产
图 3:卡车生产的 Box-Cox 转型。
在图 3 中,我们有 Box-Cox 变换。现在,重要的是检查变换是否足以使分布标准化。我们该如何做到这一点?再次绘制概率图。
卡车生产
图 4:卡车生产 Box-Cox 变换的概率图。
从图 4 可以看出,数据已令人满意地标准化,但它仍然不是完全正态分布。如果我们制作一个单独的图表,我们就会观察到问题。只要看看图 4,就可以清楚地看到有 3 种不同的分布:一个在系列的开头,另一个在系列的中间,另一个在系列的末尾。让我们制作一个转换后的变量的单独图表来分析这一点。
卡车生产
图 5:卡车生产转型的个体图。
从图 5 中,您可以看到销量改变了其行为。我们又回到了80年代末90年代初的销售模式,我们的工人该怎么办?如果我们像 80 年代末那样进行生产并采用更多技术,我们可以认为所需的劳动力会少得多。当国家恢复就业时,我们似乎不能对这个行业抱有太大期望。现在,你能做比这更好的分析吗?
如何模拟生产的演变?
现在艺术开始了。事实上,它不是艺术。这是训练。当我们查看卡车产量图表时,我们想知道什么?我们想知道这个行业是在增长还是在下降。我们如何衡量产量的增长?对于那些想要将一个月与另一个月进行比较的人来说,这是一个要点。
生产变化的时间序列怎么样?这是为什么呢?因为这样就可以了解每月变化是否高于预期。如果我们观察到本月的增长高于预期,并且产量变化遵循正态分布,那么其他月份的变化可能不会那么大。我们继续进行这个分析吗?
我的第一个搜索源是 FENABRAVE 网站,但在那里,我只找到了每月比较的 pdf 文件。你知道那件事不会通向任何地方吗?将某个月与另一个月或今年与去年的一段时间进行比较?是的,亲爱的床。人们撕毁了戴明深层知识中的“理解变异” ,而不断地比较正常原因的变异。
经过这次搜索,我到达了 ANFAVEA 网站,在那里我找到了一个很好的基地。网站上有一个历史系列的链接,可以在 Excel 中快速下载。找到这样的地方是多么好的事情,其数据是由那些理解的人构建的。但让我们进入正题吧?让我们继续分析巴西的汽车市场。
卡车销售情况如何?
为了开始分析,我建议我们先了解一下基础知识。那么,分 黎巴嫩数据 析时间序列的基本图表是什么?著名的趋势图(或线),或者顾名思义:Times Series Plot。在图 1 中,我们显示了巴西卡车产量和国家卡车许可数量的趋势图。
卡车生产
图 1:全国卡车产量和许可趋势图。
从图1中,通过这个简单的图表,你可以看到,从2012年到现在,市场的跌幅一直很强劲。很明显,生产符合许可,也就是说,该行业似乎遵循国内市场。即使销量急剧下降,出口仍然不足以保持我们的生产强劲。
如何制作数据分析控制图?
如果你是我们学校毕业的绿带或黑带,我敢打赌,当你读到这个新闻时,你的脑子里已经在说话了:控制图,控制图……冷静下来。我们开始做吧。但问题来了:使用哪个图表?
变量的类型是什么?
物品的产量是连续变量、计数变量还是分类变量?由于我们无法生产半辆卡车,因此我们说产量是一个离散变量,因此我们将其分类为计数。正确的?不。生产不是属性变量,因为我不想计算总体中的缺陷或问题。因此,为了分析卡车生产,我必须使用变量控制图。
但是,您还记得,使用变量控制图(X-bar R、X-bar s、I 和 MR 或 CUSUM)时必须做出的假设是分布是正态的。但这种分布真的正常吗?为了检查特征的个体或平均结果的正态性,可以应用多种技术,例如使用直方图、坚持性检验(Anderson-Darling、Kolmogorov-Smirnov 或 Shapiro-Wilk)或概率图(QQ 图或图表)纸)。
我们已经在博客上讨论过使用 Minitab 软件进行正态性检验的程序。但在这里,为了测试正态性,我们将使用概率图。
卡车生产
图 2:卡车生产概率图。
从图 2 可以看出,分布不是正态的。而且,如果我们稍微思考一下,就会发现这是有道理的,不是吗?我们不能指望从我父亲出生那年(1957年)至今,卡车的月产量会呈正态分布。产量持续 60 年停滞不前,意味着我们卡车运输物品的产量在此期间没有增长。鉴于这种情况,该怎么办?Box-Cox 变换?我不知道,我们来测试一下。
如何对待非正态分布?
卡车生产
图 3:卡车生产的 Box-Cox 转型。
在图 3 中,我们有 Box-Cox 变换。现在,重要的是检查变换是否足以使分布标准化。我们该如何做到这一点?再次绘制概率图。
卡车生产
图 4:卡车生产 Box-Cox 变换的概率图。
从图 4 可以看出,数据已令人满意地标准化,但它仍然不是完全正态分布。如果我们制作一个单独的图表,我们就会观察到问题。只要看看图 4,就可以清楚地看到有 3 种不同的分布:一个在系列的开头,另一个在系列的中间,另一个在系列的末尾。让我们制作一个转换后的变量的单独图表来分析这一点。
卡车生产
图 5:卡车生产转型的个体图。
从图 5 中,您可以看到销量改变了其行为。我们又回到了80年代末90年代初的销售模式,我们的工人该怎么办?如果我们像 80 年代末那样进行生产并采用更多技术,我们可以认为所需的劳动力会少得多。当国家恢复就业时,我们似乎不能对这个行业抱有太大期望。现在,你能做比这更好的分析吗?
如何模拟生产的演变?
现在艺术开始了。事实上,它不是艺术。这是训练。当我们查看卡车产量图表时,我们想知道什么?我们想知道这个行业是在增长还是在下降。我们如何衡量产量的增长?对于那些想要将一个月与另一个月进行比较的人来说,这是一个要点。
生产变化的时间序列怎么样?这是为什么呢?因为这样就可以了解每月变化是否高于预期。如果我们观察到本月的增长高于预期,并且产量变化遵循正态分布,那么其他月份的变化可能不会那么大。我们继续进行这个分析吗?