新浪博客

基于Copula函数的洪峰洪量联合分布研究(侯芸芸 宋松柏)

2013-02-18 21:17阅读:
基于Copula函数的洪峰洪量联合分布研究
(侯芸芸 宋松柏)

摘要: 采用Archim edean Copula函数族中的4种函数以陕北地区神木站48 a的洪水资料为例进行了洪峰和洪量的联合分布及两变量的联合重现期计算。结果表明: 通过相依性度量神木站洪峰和洪量有较高的相依性; Fank Copula函数拟合洪峰和洪量的联合分布效果较好; 运用Copula函数进行洪峰洪量联合分布的计算相对简单、灵活可应用于多变量水文频率分析计算。
: Copula函数; 洪水频率分析; 联合分布; 洪峰; 洪量
中图分类号: P333  文献标识码: A  do:
i 10. 3969 / .j issn. 1000-1379. 2010. 11. 017
洪水特性包括洪峰流量、洪水总量、峰现时间、洪水历时等。现行的洪水频率分析中一是局限于采用单变量分布进行洪水特征量频率分析忽略了洪水总量、峰现时间、洪水历时、洪峰流量等因素之间的相关关系不能全面地描述洪水特征[1] ; 二是应用多元正态分布或者采用具有相同的边缘分布描述多变量联合分布[2]。这两种方法都不能全面地描述洪水事件的内在规律和分析各个特征属性之间的相互关系。
Copula函数[3- 5] 是构建多变量联合分布的一种有效方法,可以构造边缘分布为任意分布的多变量联合分布函数描述变量之间的相关性结构具有极强的适应性和灵活性。在多变量水文分析计算中,Copula 函数理论主要应用于洪水频率、降水频率、干旱特征分析、洪水或降水遭遇问题以及水文随机模拟等方面[6- 10] 。笔者以陕北神木站为例应用Archim edean Copula函数构建边缘分布均服从P-型分布的最大洪峰流量以及洪量之间的联合分布进行洪水事件的联合分析推求洪峰、洪量两变量的联合分布函数以及联合重现期并且将两变量联合分布结果与单变量的洪水频率分析结果进行比较以期为陕北地区水利工程规划和防洪抗灾提供依据。
1 Copula函数和重现期
Copula函数是定义在[0,1] 区间均匀分布的联合分布函数。设H 为一个n 维分布函数其边缘分布为F1F2、…Fn,则存在一个n- Copula 函数C,使得对任意xRn,
H (x1,x2,,xn) = C [F 1 (x 1),F 2 (x 2),,Fn (xn) ] (1)
F1F2、…Fn 是连续的C 是唯一的; C 为一个n -Copula,F1F 2、…F n 为分布函数。Copula 函数分椭圆型、二次型和Archimedean型三大类。目前水文领域最常用的是Archimedean Copula函数族中的函数主要有以下几种。
(1) Gum be l- Hougaard (G- H) Copula函数。
C (u,v) = e- [(- ln u)θ+ (- ln v)θ] 1 /θ  θ[1,%) (2)
(2) Clayton Copula函数。
C (u,v) = (u-θ+ v-θ- 1) - 1/θ  θ (0,%) (3)
(3) Ali-Mikhail- Haq (AMH) Copula函数。
C (u,v) = uv / [1 -θ(1 - u) (1 - v) ] θ[- 1,1)(4)
(4) Frank Copula函数。
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
式中: C 2- Copula; u v 均为边缘分布函数,u = Fx (x) ,v =Fy (y); θ为Copula函数的参数。
在洪水事件中人们通常关注的是洪峰和洪量超过某一特定值的概率。因此洪水频率计算主要是用来确定一定频率下的设计洪水值或者是一定洪水设计值下的设计标准即重现期。设洪水事件中的两个特征变量为X Y,单变量洪水重现期为
T (x) = 1 / [1 - Fx (x) ] (6)
T (y) = 1 / [1 - Fy (y) ] (7)
式中: T (x) 为单变量X 的重现期; T (y) 为单变量Y的重现期。
对于两变量重现期一般有两变量联合重现期和两变量同现重现期。两变量联合重现期表示水文事件中水文变量X Y超过某一特定值计算公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
两变量同现重现期表示水文事件中X Y都超过某一特定值,计算公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
2 变量相依性度量
因为Copula 函数是用来刻画变量间相依关系[11] 的函数,所以首先应进行随机变量间相依性的度量。相关系数ρ只能刻画具有线性关系的相关性对于非线性关系则不能取得正确的结果因此人们常用Kendall秩相关系数和Spearman秩相关系数[12] 来进行相依性度量。
对于洪水样本(xi,yi),i= 1,2,,n,Kendall秩相关系数的计算公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
式中Kendall秩相关系数; (x i,yi) 为实测点据; n 为系列长度。
Spearman秩相关系数的计算公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
式中: ρn Spearman秩相关系数; R i Si 分别代表变量X Y的秩次。
Copula函数包含了随机变量的全部相关信息无论是Kendall秩相关系数还是Spearman秩相关系数都可以用Copula函数进行唯一的表示[13] :
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
3 Copula函数参数估计
3. 1 边缘分布函数参数估计
单变量分布函数的参数估计一般采用矩法、极大似然法、权函数法、线性矩法、适线法等方法进行估计笔者采用矩法进行参数初估再运用离差平方和最小法[14] 对参数进行优化以得到拟合较好的参数值。计算公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
式中: SL (θ) 为离差平方和最小法的目标函数;φ为离均系数;Pi 为频率; x i 为洪水特征量的观测值; x()为洪水特征量的均值;CV 为洪水特征量的变差系数; CS 为洪水特征量的偏态系数; n为系列长度。
3. 2 Copula函数参数估计
常用的Copula 函数参数估计方法有极大似然法[15] 、相关性指标法[16] IFM 估计法/M BP估计法[17] 等。其中相关性指标法主要是运用Copula 函数的参数θ与Kendall秩相关系数之间的关系(见表1)来间接计算参数θ其他方法主要是运用似然思想的计算方法。
1 Copula函数的参数θ与Kendal l秩相关系数τ之间的关系
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
4 拟合优度评价
为了了解选定的Copu la 函数能否描述变量间的相关性结构需要对Copula 函数进行拟合检验。为了检验两变量的理论联合分布函数在洪水频率分析中的拟合程度一般将各个观测点据(xi,yi) 的经验联合分布和理论联合分布进行比较。计算经验联合分布的公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
式中: nm,k为同时满足Xx i Yy i 时联合观测值的个数。
拟合优度评价是选择联合分布函数的重要指标。常用的检验方法有离差平方和最小准则法、AIC 信息准则法[18- 19]以及OLS 方法。笔者采用AIC 信息准则法进行拟合优度评价。
(1) AIC 信息准则包括经验点与理论Copula函数拟合的偏差以及Copula函数的参数个数导致的不稳定性两部分。
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
式中: Femp (x i,yi)C (ui,vi) 分别为经验频率和理论频率; k 为模型参数的个数。AIC 值越小,Copula函数拟合得越好。
(2) 采用离差平方和最小准则(OLS) 来评价Copula方法的有效性并选取OLS 最小的Copula作为联结函数。OLS 的计算公式为
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
5 实例应用
以陕北地区神木站48 a的洪水资料为例选取该站每年的最大洪峰流量和洪水总量作为洪水特征变量计算洪峰和洪量的联合分布函数以及联合重现期。
5. 1 相依性度量
运用式(10)和式(11)分别对神木站洪水资料进行洪峰和洪量的相依性度量得τ= 0. 781 9、ρn = 0. 929 1。由此可见神木站洪峰和洪量之间存在较高的相关性。因此可以运用Copu la 函数建立两变量的联合分布函数。
5. 2 边缘分布函数参数以及Copula函数参数的确定
采用P- 型分布作为洪峰和洪量的单变量分布函数运用矩法进行单变量的参数初估再对初估值进行优化。计算得到洪峰的均值、变差系数和偏态系数分别为x() = 3 608. 96 m3 / sCV = 1. 09CS = 1. 99,洪量的均值、变差系数和偏态系数分别为x() = 5 026. 7m3CV = 0. 95C S = 1. 52
Kendall秩相关系数 = 0. 781 9,通过Copula 函数的参数和Kendall秩相关系数之间的关系式(1),分别求出4Copula 函数的参数值得到G- H Copula函数、Clayton Copula函数、AMH Copula 函数和Frank Copula 函数的参数分别为
4.585 47. 170 70. 893316. 514 6
5. 3 拟合优度评价
将计算得到的经验联合分布值和用4Copu la函数计算得到的理论联合分布值分别点绘在图中(见图1) ,可以看出其均分布在45°线附近拟合效果比较好。因此说明所建立的联合分布函数是合理的。
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
1 经验联合分布与理论联合分布的拟合
为了选择拟合最好的Copula 函数利用AIC 信息准则和OLS 准则进行拟合优度评价由式(19)、式(20)和式(21)得到G – H Copula 函数、Clay ton Copula 函数、AMH Copula 函数和Frank Copula 函数的AIC 值和OLS (见表2),可见Frank Cop?u la函数拟合最好。
2 运用AIC信息准则和OLS 准则进行拟合优度评价
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
5. 4 变量重现期等值线以及联合分布函数图的绘制
给定重现期分别为1 000500100502010 a5 a绘制Frank Copula 函数下的重现期等值线图以及联合分布函数图,根据等值线图就可以得到任意重现期下两变量的各种组合(见图2、图3)
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
5. 5 单变量分析以及两变量联合分布分析的比较
采用洪峰和洪量为同频率的假定通过单变量洪水频率分析法得到不同频率的设计洪峰和设计洪量值以及基于FrankCopula 函数计算两变量联合分布下的设计洪峰值和设计洪量值给定一定重现期由式(5) 反求得各个重现期下的同频率值u = v的情况再通过边缘分布函数的逆函数求得相应的洪峰或者洪量值。
14Q = Fx -1(u) (22)
W = FY- 1 (v) (23)
式中: Q 为洪峰值; W 为洪量值。
同时可以计算得到在联合设计值下的重现期(见表3)
3 不同重现期的洪峰和洪量值
基于Copula函数的洪峰洪量联合分布研究(侯芸芸 <wbr>宋松柏)
由表3可以看出在一定设计重现期下基于两变量联合分布计算得到的洪峰和洪量值均大于由单变量计算得到的设计值各特征值的重现期也高于设计重现期。因此基于两变量联合分布得到的洪水频率分析计算结果较单变量的计算结果偏于安全。
6
以陕北神木站48 a的洪水资料为例采用Archimedean Copula函数中的4种函数建立边缘分布为P-型分布并具有较高相依性关系的洪峰和洪量的联合分布;通过拟合优度检验得到Frank Copula 拟合效果最好可用于计算陕北神木站的联合分布; Frank Copula函数的两变量联合分布的洪水频率计算结果与单变量洪水频率计算结果进行比较得到两变量联合分布的结果较单变量的偏于安全并绘制出联合重现期的等值线图以及洪峰和洪量的联合分布图。因此基于Copula函数的两变量联合分布的洪水频率分析方法能更好地描述洪水特征量之间的关系且对边缘分布类型没有限制不失为洪水频率分析计算的一种较优算法。
参考文献:
[1] 谢华黄介生. 两变量水文频率分布模型研究述评[J]. 水科学进展,2008(3) : 443- 452.
[2] 戴昌军梁忠民. 多维联合分布计算方法及其在水文中的应用[J] . 水利学报,2006(2) : 160- 165.
[3] D J Dupuis. Using Copulasin Hydrology: Benefits,Cautions and Issues[J]. Journal of Hydro logic Engineering,2007(4): 381- 393.
[4] G Salvadori ,C D Michele. On the Use of Copulas in Hydrology: Theory and Practice[J] . Journal of Hydrolog ic Engineering,2007(4): 369- 380.
[11] 唐家银何平. 基于Copula 函数对随机变量间相依性的度量[J] . 江汉大学学报: 自然科学版,2006(4): 5- 9.
[12] Christian Genes,t Anne- Catherine Favre. Everything You Always Wanted to Know about Copula Mode ling but Were Afraid to Ask[J] . Journal of Hydrologic Engineering,2007(4) : 347- 368.
[13] 严忠权. 随机变量相依关系的度量[J] . 黔南民族师范学院学报,2008(6) :34- 38.
[14] 宋松柏康艳荆萍. 水文频率曲线参数优化估计研究[J]. 西北农林科技大学学报: 自然科学版,2008(4): 193- 198.
[15] 邱小霞刘次华吴娟. Copula 函数中参数极大似然估计的性质[J]. 经济数学,2008(2): 210- 215.
[16] 杜江陈希镇于波. Archimedean Copul函数的参数估计[J]. 科学技术与工程,2009(3): 637- 640.
[17] 杨益党罗羡华. Copula函数的参数估计[J]. 新疆师范大学学报: 自然科学版,2007(2): 15- 18.
[18] 单国莉陈东峰. 一种确定最优Copula的方法及应用[J] . 山东大学学报:理学版,2005(4): 66- 69.
[19] Cheng wang,N i- Bin Chang,Gour- Tsyh Yeh. Copula- based flood frequency analys is at the confluences o f confluences of river system [J ]. Hydro logical Processes,2009(2): 7273- 7288.
作者简介: 侯芸芸(1984) ,陕西凤翔人硕士研究生研究方向为流域水文模拟。

我的更多文章

下载客户端阅读体验更佳

APP专享