概率与统计
概率统计其实是两个不同的概念。
概率 probability
概率是已知模型和参数,计算模型产生的的结果。统计 statistics
统计是有一堆数据,利用数据去推测模型和参数。 最大似然估计,最大后验估计、贝叶斯估计都是用来推测模型和参数的方法,属于统计。
统计假设检验是参数未知,使用已知数据推断某种假设是否成立。假设检验的种类包括:t检验,Z检验,卡方检验,F检验等等。
概率函数和似然函数
概率和似然看起来是两个很相似的概念,但是在统计学中,概率函数和似然函数却是两个不同的概念。
对于函数\(P(x|θ)\),输入有两个,\(x\)表示一个具体的数据;\(θ\)表示模型的参数。
- 概率函数
对于函数\(P(x|θ)\),如果\(θ\)已知,\(x\)未知,这个函数就叫概率函数(probability function),它描述的是对于不同的样本点,其出现的概率是多少。 (相当于机器学习和深度学习的测试test过程,此时参数是训练好的,\(θ\)是确定的)
- 似然函数
对于函数\(P(x|θ)\),如果\(x\)已知,\(θ\)未知,这个函数就叫似然函数(likelihood function),它描述的是对于不同的模型参数,出现这个x样本点的概率。 (相当于机器学习/深度学习模型的训练train过程,此时参数未确定,\(x\)是确定的)