首页 广东医科大学 广东医科大学统计学

广东医科大学统计学

广东医科大学统计学介绍:统计是一种综合的科学来推断被测对象的本质,甚至通过搜索、整理、分析和描述数据来预测对象的未来。那么,以上是统计教科书中统计的定义!但最近,谷歌的一位统计学家写了一篇长篇文章说:“统计数据很无聊。”CassieKozyrkov,一位统计学家,目前是谷歌的首席决策者。在这篇文章中,她提到:“不要以为我

广东医科大学统计学插图

广东医科大学统计学
介绍:统计是一种综合的科学来推断被测对象的本质,甚至通过搜索、整理、分析和描述数据来预测对象的未来。

那么,以上是统计教科书中统计的定义!

但最近,谷歌的一位统计学家写了一篇长篇文章说:“统计数据很无聊。”

CassieKozyrkov,一位统计学家,目前是谷歌的首席决策者。在这篇文章中,她提到:“不要以为我们通常做的事情看起来是‘高’的。实际上,核心是非常单调的;此外,数据是无聊的,人性化的东西是困难的。

让我们首先普及一些初级的统计学概念,然后跟随统计学家来看她的逻辑证明。

编著:王渊源,蔡洁,小琪

原文:medium

01总体

当一个普通人想到“人口”这个词时,他会怎么想?伙计,对吧?不只是一两个,而是很多,几乎每个人!在我们的学科里,它更像是万物的集合。总的来说,它可以是人、像素、南瓜、口袋妖怪,或者你喜欢的任何东西。

总的说来,是收集我们感兴趣的所有项目。

停下来一会儿,要花一些时间来确定整体情况,因为这是研究的基础。

规则是,通过写下你的一般描述,你已经决定了你是什么,没有什么能影响你的决定。通过进一步阅读,您将能够接受这些条款和相应的资格条件。

暗示你感兴趣的东西并不像听起来那么令人畏惧,记住,选择你想要感兴趣的东西是你自己的事情。没有错误的选择,只要它是具体和全面的,它可以是一个整体。接下来,我将详细介绍许多细节,并建议将下图中的树作为本文的总体兴趣。

如果我的全部就是这片森林里的树,那么它们就代表了我所关心的这个决定的一切。这些树让我很兴奋。坦率地说,这种兴奋是绝对真实的:我非常喜欢这个数字,因为我已经在我的演讲中用了很多年了。请允许我再一次怀念它。当然,有一些树漂浮在飞机上,这在空间上是非常合理的。

因为这是我的总数,我应该记住,我没有理由从我自己的分析中得出结论,我从其他森林的树木中吸取了教训。我的发现最多只适用于这些树。最糟糕的是,嗯……我只想说数据科学家有时需要在他们的生活中建立特征,而不仅仅是描述表面特征。

这里有你看不见的树吗?这样的研究毫无意义。这不是我们整体的一部分。选棵树吗?这也说不通,因为这不是你的全部。只有他们同时在一起对我们来说才有意义。这是总体概念。

02样本

人口中任何一组物品的样本。

样本是您拥有的数据,总体上是您“希望”的数据。

_这些橙色的树集合中的任何一个都是样本。我希望你们有一个更好的直觉。在后面的一篇文章中,我将向您展示如何制作一个好的样本。我将使用这个例子的其余部分来激励专业人员来证明这一点。

03观测值

观察是对样品中个别项目的测量。

我们在这棵蓝色标记的树上所做的测量是一种观察。坚持使用精确语言的人会注意到“Sample”是一组用于观察的名词。从理论上讲,“样本”作为一个复数并不表示“观察到的多个值”,而是表示“多个观测值的集合”。

04统计数据

阿!统计数字!当然,这一点很重要,因为我们根据研究数据来命名我们的主题!

通过任何方法获得统计数据以获得样本数据。

那么什么是统计数据呢?这只是一种计算数据的方法。你失望了吗?不要失望。事实证明,统计和统计是两件不同的事情。

统计的例子:如果我们对树的高度感兴趣,那么看到所有这些橙色标记树的平均高度这样的统计数字就不足为奇了。如果需要,还可以使用那些样例树高找到前三名,将它们加在一起,取对数,并将最低的两个树高之间的差的平方根相加。这个计算过程可以产生另一个统计。数据!它可能有用,也可能没有那么有用,但它也是一个统计数字。

如何证明统计学是枯燥乏味的

假设我们对这棵树的平均高度感兴趣。对于这个样本,树的平均高度正好是22.5米。这个数字对我们意味着什么?

让我们回顾一下这个概念:只对整体研究感兴趣。这样的整体样本?不,因此,对我们来说并不重要。我们从一些无聊的树上进行了一些无聊的测量,然后我们处理了这些无聊的测量……这个过程的结果也很无聊。

所以,我已经向你证明了一个事实,那就是你心里永远都知道:统计数据很无聊!证据是完整的。

06用词不当!

统计学家们疯了吗?为什么我们要用一些无聊的数字来命名我们的对象?实际上,这是一个错误的名称。

现在,我们深入分析这些术语,我们分析计算统计的主题,但统计不仅仅是关于那些数据,它是关于从这些数据中挖掘信息,以探索未知的领域。但也有可能这只是伊卡洛斯的一次飞跃,最终不会产生任何结果。

我们的主题的真名更好地反映了主题的含义,但更模糊的是:统计数据的消化。但听起来有点恶心,所以我们把它简化为平易近人。

让我来解释一下。

07参数

接下来,我们来谈谈我们的主角:参数。这件事太花哨而且太闪亮了。这是一种在演出结束后获得花束的角色,它甚至还有自己的希腊字母(通常为θ)。您可以将参数视为总体中的统计量,这是从我们感兴趣的所有群体计算得出的,但通常不能直接获得。

参数总结了总体特征。

我们承认这些树深深地使我们兴奋。现在让我总结一下您的所有顾虑。

参数值显示所有树木的真实平均高度正好是21.1米。

想象一下,今天是星期六早上,你站在这片森林空地的中央。你还没有量过一棵树,但你很想知道这个数字。这是你梦寐以求的一切。

知道参数需要什么?

你必须精确地测量所有的树!一旦你完成了,你会有什么不确定性吗?不,你有所有的信息。您可以通过分析继续计算平均值。因为你的样本是总体,所以统计数据是参数。你所面对的纯粹是一个事实。由于数据准确完整,不需要复杂的计算。

我碰巧住在纽约市,尽可能远离树木。因此,当我面临“准确测量所有这些树木”这样艰巨的任务时,惯性就开始了。我真的想知道这个参数,但我问自己:“我真的需要完全理解它或者只是测量一些树吗?也许我只需要对整个画面进行部分观察,以形成对该参数的最佳猜测。……这表面上足以完成工作要求。“

当我这样想的时候,我用一种统计的方式来思考!我永远不会知道答案。我的懒惰意味着我必须放弃获取事实或定义答案,但希望我最终会得到一些结果,这些结果仍将帮助我做出决定。我仍然可以把它变成一个合理的行动。这就是统计的本质。

08无中生有?

你们中的一些人想让我说,“有了这个神奇的公式,你们就可以把不确定性变成肯定!”“不,当然不是。没有什么神奇的东西可以凭空创造出来。

当我们不知道事实时,我们所能期望的就是把数据和假设结合起来,做出合理的决定。

09假设

一种假设是描述宇宙的样子,但不一定是真的。我们需要弄清楚我们的样本是否使先前的假设看起来可笑,以确定我们是否要改变主意,但这超出了这篇博客文章的范围。

▲我在这里说了一些凌乱的词,比如“所有树木的真实平均高度都不到20米”。这是一个假设。你知道真相(我错了!),因为你知道这个例子中的一切……但我什么都不知道。我的陈述是一个完全有效的假设,描述了潜在的真相。在得知我的假设是否合理之前,我会得到一些数据。

10估计和估计量

如果我们知道参数,就不需要这样做。我们正在寻找事实,但不幸的是事实并不总是能产生准确的结果。因为我们不能计算参数,我们只能用统计信息做出最好的猜测。

估计是一个华丽的表达最佳猜测。

估计只是对参数真值的最佳猜测的一种华丽表达。这是你的猜测,估计是你用来得到数字的公式。

让我告诉你,你对统计数字印象深刻。准备好了吗?

假设你只知道其中一棵树高23米。你能告诉我对所有树木真实平均高度的估计吗?

23米?是的,我也这么认为!

如果这是我们唯一的信息,我们只能猜测23米;如果我们猜测任何其他数字,我们只是在撒谎。我们只知道23米,所以只能猜23米。为了得到其他的东西,我们必须结合更多的信息(不是在这个例子中)或做出假设。………………..那是另一回事。

好了,我们再试一次!假设我们有一个样本,我们只知道它的平均高度为22.5米。你最大的猜测是什么。

22.5米?

根据几种教科书上的估计方法,包括矩法估计法、最大似然估计法等,最终的答案与你的直觉相同!超过99%的案例在现实生活中显示,你可以得到最好的猜测,通过把你的样本作为你的人口,并任意使用它。你不需要任何特别的课程。太好了,我们完了!

你总是需要统计数据,这是谎言;你不需要。如果您只想获得最佳猜测并获得灵感,分析是您的最佳选择。摆脱p值,你不需要不必要的压力。

相反,你可以选择按照这些原则生活:你拥有的数据越多,你的直觉就越适合做出最好的猜测,但是你不知道这些猜测有多准确……所以要谦虚。

但请不要认为我在攻击我的纪律。我在统计学上花了十多年的时间,这不是一门无用的学科。

因此,在适当的时候使用统计方法是有用和非常有用的。

最后,你什么时候真正需要统计数据?凯西也给出了这个决定图。

本文来自网络,不代表广东成人高考网立场。转载请注明出处: https://auee.gz-qy.com/xiao/yike/2899.html
上一篇
下一篇
阿枫

作者: 阿枫

天下万物为我所用,不为我所有。

为您推荐

联系我们

联系我们

020-82258225

在线咨询: QQ交谈

邮箱: wlb@020edu.cn

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部