Python随机采样及概率分布(二)

沃梦达教程 Python开发

2023-08-11

Python随机采样及概率分布(二) 目录 1. 二项(binomial)/伯努利(Bernoulli)分布 1.1 概率质量函数(pmf) 1.2 函数原型 1.3 使用样例 2. 多项(multinomial)分布 2.1 概率质量函数(pmf) 2.2 函数原型 2.3 使用样例 3.均匀(uniform)分布 3.1 概率密度函数(pdf) 3.2 函数原型 3.3 使用

1. 二项（binomial）/伯努利（Bernoulli）分布

1.1 概率质量函数(pmf)

二项分布P(X=x; n, p)可以表示进行独立重复试验n次，每次有两成功和失败可能结果（分别对应概率p和1−p），共成功x次的概率。

1.2 函数原型

random.binomial(n, p, size=None)


参数：
n: int or array_like of ints   对应分布函数中的参数 n，>=0，浮点数会被截断为整形。
p: float or array_like of floats   对应分布函数参数p, >=0并且<=1。
size: int or tuple of ints, optional   如果给定形状为(m,n,k)，那么m×n×k个随机样本会从中抽取。默认为None，即返回一个一个标量随机样本。

返回：
out: ndarray or scalar  从带参数的概率分布中采的随机样本，每个样本表示独立重复实验n次中成功的次数。

1.3 使用样例
设进行独立重复实验10次，每次成功概率为0.5，采样样本表示总共的成功次数（相当于扔10次硬币，正面朝上的次数）。总共采20个样本。
import numpy as np
n, p = 10, .5  
s = np.random.binomial(n, p, 20)
print(s) # [4 5 6 5 4 2 4 6 7 2 4 4 2 4 4 7 6 3 5 6]

可以粗略的看到，样本几乎都在5周围上下波动。
我们来看一个有趣的例子。一家公司钻了9口井，每口井成功的概率为0.1，所有井都失败了，发生这种情况的概率是多少？
我们总共采样2000次，来看下产生0结果的概率。
s = sum(np.random.binomial(9, 0.1, 20000) == 0)/20000.
print(s) # 0.3823

可见，所有井失败的概率为0.3823，这个概率还是蛮大的。
2. 多项（multinomial）分布

2.1 概率质量函数(pmf)

也就是说，多项分布式二项分布的推广：仍然是独立重复实验n次，但每次不只有成功和失败两种结果，而是k种可能的结果，每种结果的概率为pi。多项分布是一个随机向量的分布，x=(x1,x2,...,xk)意为第i种结果出现xi次，P(X=x; n, p)也就表示第i种结果出现xi次的概率。
2.2 函数原型

random.multinomial(n, pvals, size=None)

参数：
n: int   对应分布函数中的参数 n。
pvals: sequence of floats   对应分布函数参数p, 其长度等于可能的结果数k，并且有0⩽pi⩽1。
size: int or tuple of ints, optional   为输出形状大小，因为采出的每个样本是一个随机向量，默认最后一维会自动加上k，如果给定形状为(m,n)，那么m×n个维度为k的随机向量会从中抽取。默认为None，即返回一个一个k维的随机向量。
返回：
out: ndarray   从带参数的概率分布中采的随机向量，长度为可能的结果数k，如果没有给定 size，则shape为 (k,)。
2.3 使用样例
设进行独立重复实验20次，每次情况的概率为1/6，采样出的随机向量表示每种情况出现次数（相当于扔20次六面骰子，点数为0, 1, 2, ..., 5出现的次数）。总共采1个样本。
s = np.random.multinomial(20, [1/6.]*6, size=1)
print(s) # [[4 2 2 3 5 4]]
当然，如果不指定size，它直接就会返回一个一维向量了
s = np.random.multinomial(20, [1/6.]*6)
print(s) # [4 1 4 3 5 3]
如果像进行多次采样，改变 size即可：
s = np.random.multinomial(20, [1/6.]*6, size=(2, 2))
print(s)
# [[[4 3 4 2 6 1]
#   [5 2 1 6 3 3]]

#  [[5 4 1 1 6 3]
#   [2 5 2 5 4 2]]]
这个函数在论文<sup>[1]</sup>的实现代码<sup>[2]</sup>中用来设置每一个 client分得的样本数：
for cluster_id in range(n_clusters): 
    weights = np.random.dirichlet(alpha=alpha * np.ones(n_clients))
    clients_counts[cluster_id] = np.random.multinomial(clusters_sizes[cluster_id], weights)
    # 一共扔clusters_sizes[cluster_id]次筛子，该函数返回骰子落在某个client上各多少次，也就对应着该client应该分得的样本数

3.均匀（uniform）分布

3.1 概率密度函数(pdf)

均匀分布可用于随机地从连续区间[a,b)内进行采样。
3.2 函数原型

random.uniform(low=0.0, high=1.0, size=None)

参数：
low: float or array_like of floats, optional   对应分布函数中的下界参数 a，默认为0。
high: float or array_like of floats   对应分布函数中的下界参数 b，默认为1.0。
size: int or tuple of ints, optional   为输出形状大小，如果给定形状为(m,n,k)，那么m×n×k的样本会从中抽取。默认为None，即返回一个单一标量。
返回：
out: ndarray or scalar   从带参数的均匀分布中采的随机样本
3.3 使用样例

s = np.random.uniform(-1,0,10)
print(s)
# [-0.9479594  -0.86158902 -0.63754099 -0.0883407  -0.92845644 -0.11148294
#  -0.19826197 -0.77396765 -0.26809953 -0.74734785]

4. 狄利克雷(Dirichlet)分布

4.1 概率密度函数(pdf)

P(x;α)∝∏i=1kxαi−1ix=(x1,x2,...,xk),xi>0,∑i=1kxi=1α=(α1,α2,...,αk).αi>0


4.2 函数原型

random.dirichlet(alpha, size=None)

参数：
alpha: sequence of floats, length k   对应分布函数中的参数向量 α，长度为k。
size: int or tuple of ints, optional   为输出形状大小，因为采出的每个样本是一个随机向量，默认最后一维会自动加上k，如果给定形状为(m,n)，那么m×n个维度为k的随机向量会从中抽取。默认为None，即返回一个一个k维的随机向量。
返回：
out: ndarray   采出的样本，大小为(size,k)。
4.3 使用样例
设α=(10,5,3)(意味着k=3)，size=(2,2)，则采出的样本为2×2个维度为k=3的随机向量。
s = np.random.dirichlet((10, 5, 3), size=(2, 2))
print(s)
# [[[0.82327647 0.09820451 0.07851902]
#   [0.50861077 0.4503409  0.04104833]]

#  [[0.31843167 0.22436547 0.45720285]
#   [0.40981943 0.40349597 0.1866846 ]]]
这个函数在论文[1]的实现代码[2]中用来生成符合狄利克雷分布的权重向量
for cluster_id in range(n_clusters): 
    # 为每个client生成一个权重向量，文章中分布参数alpha每一维都相同
    weights = np.random.dirichlet(alpha=alpha * np.ones(n_clients))
    clients_counts[cluster_id] = np.random.multinomial(clusters_sizes[cluster_id], weights)
到此这篇关于Python随机采样及概率分布(二)的文章就介绍到这了,更多相关Python随机采样及概率分布内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！


	
	
		
			
				
				 沃梦达教程
				本文标题为：Python随机采样及概率分布(二)
				
				
                     
						
						
            		
            		
			
		
	



	
	
		        
            
				
            	上一篇：
                Python 十大特性
            
        
	
	
				
             
            
            	下一篇：
            	Python爬取当网书籍数据并数据可视化展示
            
        
	    	
	
								


	
		 基础教程推荐
	
	
		
		
		
	
    	
	
    	
    
        
           
            
                学习HTML
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习jQuery
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习Laravel
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习CSS3
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习Vue.js
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习Bootstrap5
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习ThinkPHP
        
        
	

		
	
    	
	
    	
    
        
           
            
                学习AJAX
        
        
	
		
	
																	


	
	    
             猜你喜欢
        
	     
            
                基于Python实现股票数据分析的可视化
                2023-08-04
            

                四步教你学会打包一个新的Python模块
                2022-10-20
            

                Python爬取当网书籍数据并数据可视化展示
                2023-08-11
            

                ubuntu 18 python3.6 的安装与 python2的版本切换
                2023-09-03
            

                CentOS 7.5 安装 Python3.7
                2023-09-03
            

                Python基础学习之函数和代码复用详解
                2022-09-02
            

                python的环境conda简介
                2022-10-20
            

                Centos7下安装python环境
                2023-09-04
            

                centos系统 anaconda3（python3）安装pygrib
                2023-09-04
            

                Python 中 Elias Delta 编码详情
                2023-08-08



        
            
		
		
			最新文章
		
		
				
				2023-09-05
				远程和Ubuntu服务器进行Socket通信，使用python和C#（准备篇）
			

				2023-09-05
				使用python控制nginx禁封ip
			

				2023-09-05
				用10分钟，搭建图像处理编程环境，0失败！（python语言，windows系统）
			

				2023-09-05
				centos 服务器安装python 2.7.15
			

				2023-09-05
				如何更改Ubuntu 16.04 默认Python版本方法
			

			
		

	
	
		热门文章
	
	
		
			
				
					
						
							
						
					
					
						
							
								python 实现syslog 服务器的详细过程
							
							
								2022-08-30
								208
							
						
					
				
			
		

			
				
					
						
							
						
					
					
						
							
								conda创建环境、安装包、删除环境步骤详细记录
							
							
								2022-08-30
								131
							
						
					
				
			
		

			
				
					
						
							
						
					
					
						
							
								Matplotlib学习笔记之plt.xticks()用法
							
							
								2022-10-20
								86
							
						
					
				
			
		

			
				
					
						
							
						
					
					
						
							
								Python遗传算法Geatpy工具箱使用介绍
							
							
								2022-10-20
								78
							
						
					
				
			
		

			
				
					
						
							
						
					
					
						
							
								matplotlib中plt.hist()参数解释及应用实例
							
							
								2022-08-30
								76
							
						
					
				
			
		

	

 
	 
	
		编程基础
	
	
		
			
			    
				学习PHP
			
		

			
			    
				学习JAVA
			
		

			
			    
				学习ASP.NET
			
		

			
			    
				学习Python
			
		
	

	
		
			热门标签
		
		
			 
		           
		
		word           
		
		dedecms           
		
		织梦           
		
		php           
		
		正则表达式           
		
		匹配           
		
		video           
		
		跨域问题           
		
		区块链           
		
		定时任务           
		
		资源映射           
		
		设计模式           
		
		代理模式           
		
		EasyExcel           
		
		运行原理           
		
		归并排序           
		
		排序算法           
		
		希尔排序           
		
		快速排序           
		
		冒泡排序           
		
		经典算法           
		
		Nacos           
		
		对象转换           
		
		Springboot           
		
		mysql           
		
		远程连接           
		
		过滤器           
		
		监听器           
		
		多进程           
		
		图片上传           
		
		无刷新           
		
		wushuaxi           
		
		wusu           
		
		wus           
		
		加载           
		
		url编码           
		
		jdk           
		
		Socket           
		
		循环语句