首页 > 资讯 > 后端开发 > Python >Python实现8个概率分布公式的方法详解

219

分享到

Python实现8个概率分布公式的方法详解

2024-04-02 19:04:59 219人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

目录前言1.均匀分布2.高斯分布3.对数正态分布4.泊松分布5.指数分布6.二项分布7.学生 t 分布8.卡方分布前言在本文中，我们将介绍一些常见的分布并通过python 代码进行

前言

在本文中，我们将介绍一些常见的分布并通过python 代码进行可视化以直观地显示它们。

概率和统计知识是数据科学和机器学习的核心；我们需要统计和概率知识来有效地收集、审查、分析数据。

现实世界中有几个现象实例被认为是统计性质的（即天气数据、销售数据、财务数据等）。这意味着在某些情况下，我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然。

“概率分布是一个数学函数，它给出了实验中不同可能结果的发生概率。”

了解数据的分布有助于更好地模拟我们周围的世界。它可以帮助我们确定各种结果的可能性，或估计事件的可变性。所有这些都使得了解不同的概率分布在数据科学和机器学习中非常有价值。

1.均匀分布

最直接的分布是均匀分布。均匀分布是一种概率分布，其中所有结果的可能性均等。例如，如果我们掷一个公平的骰子，落在任何数字上的概率是 1/6。这是一个离散的均匀分布。

但是并不是所有的均匀分布都是离散的——它们也可以是连续的。它们可以在指定范围内取任何实际值。a 和 b 之间连续均匀分布的概率密度函数 (pdf) 如下：

让我们看看如何在 Python 中对它们进行编码：

import numpy as np  
import matplotlib.pyplot as plt 
from scipy import stats 
 
# for continuous  
a = 0 
b = 50 
size = 5000 
 
X_continuous = np.linspace(a, b, size) 
continuous_unifORM = stats.uniform(loc=a, scale=b) 
continuous_uniform_pdf = continuous_uniform.pdf(X_continuous) 
 
# for discrete 
X_discrete = np.arange(1, 7) 
discrete_uniform = stats.randint(1, 7) 
discrete_uniform_pmf = discrete_uniform.pmf(X_discrete)  
 
# plot both tables 
fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(15,5)) 
# discrete plot 
ax[0].bar(X_discrete, discrete_uniform_pmf) 
ax[0].set_xlabel("X") 
ax[0].set_ylabel("Probability") 
ax[0].set_title("Discrete Uniform Distribution") 
# continuous plot 
ax[1].plot(X_continuous, continuous_uniform_pdf) 
ax[1].set_xlabel("X") 
ax[1].set_ylabel("Probability") 
ax[1].set_title("Continuous Uniform Distribution") 
plt.show()

2.高斯分布

高斯分布可能是最常听到也熟悉的分布。它有几个名字：有人称它为钟形曲线，因为它的概率图看起来像一个钟形，有人称它为高斯分布，因为首先描述它的德国数学家卡尔·高斯命名，还有一些人称它为正态分布，因为早期的统计学家注意到它一遍又一遍地再次发生。

正态分布的概率密度函数如下：

σ 是标准偏差，μ 是分布的平均值。要注意的是，在正态分布中，均值、众数和中位数都是相等的。

当我们绘制正态分布的随机变量时，曲线围绕均值对称——一半的值在中心的左侧，一半在中心的右侧。并且，曲线下的总面积为 1。

mu = 0 
variance = 1 
sigma = np.sqrt(variance) 
x = np.linspace(mu - 3*sigma, mu + 3*sigma, 100) 
 
plt.subplots(figsize=(8, 5)) 
plt.plot(x, stats.norm.pdf(x, mu, sigma)) 
plt.title("Normal Distribution") 
plt.show()

对于正态分布来说。经验规则告诉我们数据的百分比落在平均值的一定数量的标准偏差内。这些百分比是：

68% 的数据落在平均值的一个标准差内。
95% 的数据落在平均值的两个标准差内。
99.7% 的数据落在平均值的三个标准差范围内。

3.对数正态分布

对数正态分布是对数呈正态分布的随机变量的连续概率分布。因此，如果随机变量 X 是对数正态分布的，则 Y = ln(X) 具有正态分布。

这是对数正态分布的 PDF：

对数正态分布的随机变量只取正实数值。因此，对数正态分布会创建右偏曲线。

让我们在 Python 中绘制它：

X = np.linspace(0, 6, 500) 
 
std = 1 
mean = 0 
lognorm_distribution = stats.lognorm([std], loc=mean) 
lognorm_distribution_pdf = lognorm_distribution.pdf(X) 
 
fig, ax = plt.subplots(figsize=(8, 5)) 
plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=1") 
ax.set_xticks(np.arange(min(X), max(X))) 
 
std = 0.5 
mean = 0 
lognorm_distribution = stats.lognorm([std], loc=mean) 
lognorm_distribution_pdf = lognorm_distribution.pdf(X) 
plt.plot(X, lognorm_distribution_pdf, label="μ=0, σ=0.5") 
 
std = 1.5 
mean = 1 
lognorm_distribution = stats.lognorm([std], loc=mean) 
lognorm_distribution_pdf = lognorm_distribution.pdf(X) 
plt.plot(X, lognorm_distribution_pdf, label="μ=1, σ=1.5") 
 
plt.title("Lognormal Distribution") 
plt.legend() 
plt.show()

4.泊松分布

泊松分布以法国数学家西蒙·丹尼斯·泊松的名字命名。这是一个离散的概率分布，这意味着它计算具有有限结果的事件——换句话说，它是一个计数分布。因此，泊松分布用于显示事件在指定时期内可能发生的次数。

如果一个事件在时间上以固定的速率发生，那么及时观察到事件的数量（n）的概率可以用泊松分布来描述。例如，顾客可能以每分钟 3 次的平均速度到达咖啡馆。我们可以使用泊松分布来计算 9 个客户在 2 分钟内到达的概率。

下面是概率质量函数公式：

λ 是一个时间单位的事件率——在我们的例子中，它是 3。k 是出现的次数——在我们的例子中，它是 9。这里可以使用 Scipy 来完成概率的计算。

from scipy import stats 

print(stats.poisson.pmf(k=9, mu=3))

输出：

0.002700503931560479

泊松分布的曲线类似于正态分布，λ 表示峰值。

X = stats.poisson.rvs(mu=3, size=500) 
 
plt.subplots(figsize=(8, 5)) 
plt.hist(X, density=True, edgecolor="black") 
plt.title("Poisson Distribution") 
plt.show()

5.指数分布

指数分布是泊松点过程中事件之间时间的概率分布。指数分布的概率密度函数如下：

λ 是速率参数，x 是随机变量。

X = np.linspace(0, 5, 5000) 
 
exponetial_distribtuion = stats.expon.pdf(X, loc=0, scale=1) 
 
plt.subplots(figsize=(8,5)) 
plt.plot(X, exponetial_distribtuion) 
plt.title("Exponential Distribution") 
plt.show()

6.二项分布

可以将二项分布视为实验中成功或失败的概率。有些人也可能将其描述为抛硬币概率。

参数为 n 和 p 的二项式分布是在 n 个独立实验序列中成功次数的离散概率分布，每个实验都问一个是 - 否问题，每个实验都有自己的布尔值结果：成功或失败。

本质上，二项分布测量两个事件的概率。一个事件发生的概率为 p，另一事件发生的概率为 1-p。

这是二项分布的公式：

P = 二项分布概率
= 组合数
x = n次试验中特定结果的次数
p = 单次实验中，成功的概率
q = 单次实验中，失败的概率
n = 实验的次数

可视化代码如下：

X = np.random.binomial(n=1, p=0.5, size=1000) 
 
plt.subplots(figsize=(8, 5)) 
plt.hist(X) 
plt.title("Binomial Distribution") 
plt.show()

7.学生 t 分布

学生 t 分布（或简称 t 分布）是在样本量较小且总体标准差未知的情况下估计正态分布总体的均值时出现的连续概率分布族的任何成员。它是由英国统计学家威廉·西利·戈塞特（William Sealy Gosset）以笔名“student”开发的。

PDF如下：

n 是称为“自由度”的参数，有时可以看到它被称为“d.o.f.” 对于较高的 n 值，t 分布更接近正态分布。

import seaborn as sns 
from scipy import stats 
 
X1 = stats.t.rvs(df=1, size=4) 
X2 = stats.t.rvs(df=3, size=4) 
X3 = stats.t.rvs(df=9, size=4) 
 
plt.subplots(figsize=(8,5)) 
sns.kdeplot(X1, label = "1 d.o.f") 
sns.kdeplot(X2, label = "3 d.o.f") 
sns.kdeplot(X3, label = "6 d.o.f") 
plt.title("Student's t distribution") 
plt.legend() 
plt.show()

8.卡方分布

卡方分布是伽马分布的一个特例；对于 k 个自由度，卡方分布是一些独立的标准正态随机变量的 k 的平方和。

PDF如下：

这是一种流行的概率分布，常用于假设检验和置信区间的构建。

在 Python 中绘制一些示例图：

X = np.arange(0, 6, 0.25) 
 
plt.subplots(figsize=(8, 5)) 
plt.plot(X, stats.chi2.pdf(X, df=1), label="1 d.o.f") 
plt.plot(X, stats.chi2.pdf(X, df=2), label="2 d.o.f") 
plt.plot(X, stats.chi2.pdf(X, df=3), label="3 d.o.f") 
plt.title("Chi-squared Distribution") 
plt.legend() 
plt.show()

掌握统计学和概率对于数据科学至关重要。在本文展示了一些常见且常用的分布，希望对你有所帮助。

以上就是Python实现8个概率分布公式的方法详解的详细内容，更多关于Python概率分布的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Python实现8个概率分布公式的方法详解

本文链接: https://www.lsjlt.com/news/117975.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Python实现8个概率分布公式的方法详解

目录前言1.均匀分布2.高斯分布3.对数正态分布4.泊松分布5.指数分布6.二项分布7.学生 t 分布8.卡方分布前言在本文中，我们将介绍一些常见的分布并通过Python 代码进行...

99+

2024-04-02
Python怎么实现8个概率分布公式

这篇“Python怎么实现8个概率分布公式”文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，下面我们一起来看看这篇“Python怎么实现8个概率分布公式...

99+

2023-06-30
Python+Scipy实现自定义任意的概率分布

目录连续变量分布离散变量分布二项分布Binomial Distribution几何分布Geometric Distribution泊松分布Poisson DistributionSc...

99+

2024-04-02
Redis快速实现分布式session的方法详解

目录前言Spring SecurityApache ShiroSession作用spring-session支持功能分布式seesion实战步骤1：依赖包步骤2：配置文件步骤3：实现...

99+

2024-04-02
python实现定时任务的8种方式详解

在日常工作中，常常会用到需要周期性执行的任务，一种方式是采用 Linux 系统自带的 crond 结合命令行实现。另外一种方式是直接使用Python。当每隔一段时间就要执行一段程序，或者往复...

99+

2023-09-09

python 定时任务
Redis实现分布式锁方法详细

目录1. 单机数据一致性2. 分布式数据一致性3. Redis实现分布式锁3.1 方式一3.2 方式二（改进方式一）3.3 方式三（改进方式二）3.4 方式四（改进方式三）3.5 方...

99+

2024-04-02
redis实现分布式的方法总结

一为什么使用 Redis 在项目中使用 Redis，主要考虑两个角度：性能和并发。如果只是为了分布式锁这些其他功能，还有其他中间件 Zookpeer 等代替，并非一定要使用 Redis。性能：如下图所...

99+

2024-04-02
redis中分布式锁的实现方法

小编给大家分享一下redis中分布式锁的实现方法，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！redis分布式锁：1、实现原理利...

99+

2024-04-02
redis实现分布式事务的方法

小编给大家分享一下redis实现分布式事务的方法，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！问题描述:某电商平台,首发一款新品...

99+

2024-04-02
Sphinx 分布式搜索的 PHP 实现方法解析

引言：在当今互联网时代，搜索引擎已经成为人们获取信息的主要方式之一。为了提供更高效、更准确的搜索结果，一些大规模的网站或应用程序通常会使用分布式搜索引擎来处理搜索请求。Sphinx 是一种知名的分布式搜索引擎，具有良好的性能和扩展性。本文将...

99+

2023-10-21

分布式 PHP Sphinx 方法解析
实现分布式WebSocket集群的方法

目录1、问题起因场景描述2、系统架构图本文涉及的技术栈3、技术可行性分析WebSocketSession与HttpSession4、解决方案的演变4.1、Netty与SpringWe...

99+

2024-04-02
go实现一个分布式限流器的方法步骤

目录1. 接口定义2. LocalCounterLimiter3. LocalTokenBucketLimiter4. RedisCounterLimiter5. RedisToke...

99+

2024-04-02
带你用Python实现Saga 分布式事务的方法

目录分布式事务SAGASAGA实践处理网络异常处理回滚小结银行跨行转账业务是一个典型分布式事务场景，假设 A 需要跨行转账给 B，那么就涉及两个银行的数据，无法通过一个数据库的本地事...

99+

2024-04-02
redis分布式锁的实现原理详解

首先，为了确保分布式锁可用，我们至少要确保锁的实现同时满足以下四个条件： 1.互斥性。在任意时刻，只有一个客户端能持有锁。 2.不会发生死锁。即使有一个客户端在持有锁的期间崩溃而没有...

99+

2024-04-02
分布式系统中的 Python 算法实现方式有哪些？

分布式系统是指由多个独立的计算机节点组成的系统，它们之间通过网络进行通信，共同完成一个任务。Python 是一种高级编程语言，它在分布式系统中的应用越来越广泛。本文将介绍分布式系统中的 Python 算法实现方式。一、MapReduce ...

99+

2023-09-16

编程算法分布式 linux
zookeeper实战之实现分布式锁的方法

目录一、分布式锁的通用实现思路二、ZK实现分布式锁的思路三、ZK实现分布式锁的编码实现1、核心工具类实现2、测试代码编写线程安全问题复现使用上面封装的ZkLockHelper实现的分...

99+

2022-11-13

zookeeper分布式锁 zookeeper实现分布式锁 zookeeper分布式锁原理
Spring Security实现分布式系统授权方案详解

目录1 需求分析2 注册中心3 网关3.1 创建工程3.2 token配置3.3 配置资源服务3.4 安全配置4 转发明文token给微服务5 微服务用户鉴权拦截6 集成测试7 扩展...

99+

2024-04-02
redis实现分布式session的解决方案

目录一、首先Session二、分布式Session补充：一、首先Session Session 是客户端与服务器通讯会话技术，比如浏览器登陆、记录整个浏览会话信息。session存...

99+

2024-04-02
mysql分布式锁实现的方法是什么

MySQL本身并没有提供分布式锁的实现方法，但可以借助MySQL的特性和其他技术来实现分布式锁。以下是几种常见的实现方法：1. 基于...

99+

2023-10-09

mysql
Python+OpenCV实现阈值分割的方法详解

目录一、全局阈值1.效果图2.源码二、滑动改变阈值(滑动条)1.效果图2.源码三、自适应阈值分割1.效果图2.源码3.GaussianBlur()函数去噪四、参数解释一、全局阈值原...

99+

2024-04-02