当前位置:智城范文网>范文大全 > 征文 > 可能性理论研究

可能性理论研究

时间:2022-03-05 08:07:32 来源:网友投稿

摘 要:

研究不确定性的传统方法是使用概率论和统计,但现实世界中所遇到的不确定性有多种类型,传统方法并不能全部适用。传统方法仅适于处理发生条件的不确定导致的不确定性,即已知某一个确定的事件,由于其发生条件的微小扰动,导致事件发生与否的不确定。另外一种类型的不确定性则是事件本身就存在着不确定因素,此时传统方法不再有效,而应该使用可能性理论来处理。讨论使用可能性理论处理自然语言型软数据的具体规则和方法,比较可能性理论与概率论方法的差异,并介绍可能性理论涉及的最新热点问题。

关键词:可能性理论;模糊集;软数据;软数据推理;BISC

中图分类号:TP3-0

文献标识码:A文章编号:1005-3824(2014)05-0024-04

0 引 言

1965年Lotfi A. Zadeh首次提出了模糊集的概念,将经典的刚性集合推广到具有模糊边界的模糊集合。1978年Zadeh在模糊集的基础上提出了可能性理论,旨在作为与概率论平行的研究不确定性问题的方法。可能性理论可被应用于数据处理、决策分析、模式识别和自动控制等领域,对推动认知性不确定性的研究有重要价值,正日益受到关注。本文从Zadeh的研究出发,讨论了可能性理论的含义、规则和方法,分析了可能性理论与概率论的差别和联系,介绍了可能性理论的最新热点问题。

1 可能性分布与可能性测度

定义1.1 设F是论域U的模糊子集,由其隶属函数μF和隶属度μF(u)描述, μF(u)解释为u与概念F的一致性<sup>[2]</sup>。

令X为在U上取值的变量,并将F视作一个与X有关的模糊约束R(X)。那么命题“X is F”转化为

R(X)=F(1)

将可能性分布ΠX与X联系起来,由可能性公式<sup>[1]</sup>可得:

ΠX=R(X)(2)

相应的X的可能性分布函数表示为πX,并且定义成在数值上与F的隶属度函数相等,也就是:

πXμF(3)

因此,X=u的可能性πX(u)也就等于μF(u)。

从(4)可以看出,关系分配等式(3)可以等价地表示成:

ΠX=F(4)

这个形式表明,命题“pX is F”有着联系X和其可能性分布ΠX的作用,也就是ΠX是由p诱导出的。

定义1.2 设A为U的模糊子集,变量X在U中取值,ΠX是与X相关的可能性分布。A的可能性测度π(A)定义为

Poss{X is A}π(A)Supu∈UμA(u)∧πX(u)(5)

这里Poss{X is A}代表命题“X is A”的可能性。

可能性分布πX(u)代表X取某值的可能性,而可能性测度π(A)代表X符合某种描述的可能性。

可能性分布还可以用来表示命题传达的信息<sup>[2]</sup>。命题“pX is F”诱导出可能性分布ΠX=F,那么命题p所传达的信息是I(p)ΠX=F。这是因为命题p是对X取值情况的描述,而正是X取值情况的精确化,所以可以认为命题所传达的有效内容就是X的可能性分布。对同一个事件描述地越详细,则事件发生时能传达的不确定性越小,也就是能传达的信息越少。对同一个事件来说,包含信息少的描述蕴含着包含信息多的描述,这是可能性理论的蕴含原则<sup>[3]</sup>。

2 可能性理论的应用:软数据推理

软数据大致可以分为2类:一类是不精确或者不确定的数据;另一类是可靠性值得怀疑的数据。现实情况中进行数据分析时,遇到的软数据常常是非统计的,传统的概率统计方法无法有效处理这种情况,所以需要使用可能性理论。本文中用命题的形式来表示软数据,是因为出现在软数据中的精确的词汇大多是用模糊集而不是用概率分布来进行标示的,所以才能够使用可能性理论来进行软数据分析<sup>[4]</sup>。

可能性理论的精髓在于如何从一个命题抽象出变量的分布,也就是自然语言命题的形式化。因此使得可能性理论可以用来处理用自然语言描述的数据。

这里考虑一个例子。

P1这个说法很像是准确的。

P2这个说法不像是准确的。

P3这个说法不像是非常准确的。

Q这个说法有多像是不准确的?

为了表述方便,用X表示“说法”,E表示“准确”,L表示“很像”。根据命题转化规则<sup>[4]</sup>中的修饰词规则,将“非常”定义为隶属函数的平方运算,则“非常准确”用E2来表示,同理“很”也可以如此定义。

假设“说法”从n个说法的集合中取值u的概率为p(u),说法u对“准确”的隶属度为μE(u),那么“说法准确”这个模糊事件的概率为∑nμE(u)p(u)。同理“说法非常准确”的概率为∑nμ2E(u)p(u),“说法不准确”的概率为∑n[1-μE(u)]p(u)。因此软数据命题可以转化为

P1这个说法很像是准确的。→π2(p)=μ2L(∑nμE(u)p(u))(6)

P2这个说法不太像是准确的。→π2(p)=μL(1-∑nμE(u)p(u))(7)

P3这个说法不太像是非常准确的。→π2(p)=μL(1-∑nμ2E(u)p(u))(8)

回答应该是“语义概率”的形式,所谓语义概率即是“很像”、“不太像”这类描述。我们将问题用其答案来表示“Q’这个说法不准确的程度为γ”,这里将“程度”用语义概率解释,则有:

Q’这个说法不准确的程度为γ →πq(p)=μγ(∑n[1-μE(u)]p(u))(9)

将γ视作一个从软数据库到γ的元素所在空间的映射,那么根据扩展原理<sup>[5]</sup>得:

μγ(u)maxp{μ2L(∑nμE(u)p(u))∧μL(1-

∑nμE(u)p(u))∧μL(1-∑nμ2E(u)p(u))}(10)

u=μγ(∑n[1-μE(u)]p(u))(11)

上述扩展原理的应用即为软数据推理的数学规划法应用。

上述例子中应用到了命题转化原则里的概率限制原则与修饰词原则、命题转化的可能性形式与真值形式的等价性质、软数据推理原则中的结合原则和可能性分布的扩展原则等,包含了可能性理论计算与推理的技巧,并且在使用可能性理论检验Ⅰ证据的结论的可靠度的时候也有类似的形式。

3 可能性理论与概率论的区别和联系

从概念上说,概率论处理的是外延确定的事件,由于发生条件不确定而导致随机性,是基于重复试验的从历史的角度出发的对不确定性的描述。而可能性理论针对的是外延模糊的事件,事件本身就含有模糊性,描述事件发生的难易程度,是从主观上出发对不确定性的描述。比如问题“明天下大雨的概率是多少?”,这样的问题就无法用概率论的方法解决,因为“大雨”是一个模糊外延的概念,“大雨”、“中雨”和“小雨”之间并没有明晰的分界,所以只能使用可能性原理来解答。

但是在某些情况下,可能性是可以用概率来表示的,也就是隶属度可以用概率来表示,这只在“共识基础”定义的环境中才成立。用统计方法构建以共识为基础的隶属度的定义可以用“投票模型”来表述:假设有1 000位受试者,让他们分别独立回答类似“27 mm的降雨量是属于大雨、中雨还是暴雨?”这样的问题,假设有80%的受试者认为27 mm属于大雨、15%的受试者认为属于中雨和5%的人认为属于暴雨,那么我们就可以定义27 mm对应大雨这个概念的隶属度为0.8,对应中雨的隶属度为0.15,对应暴雨的隶属度为0.05。这里的0.8是一个随机选中的投票者将27 mm的降雨量归于大雨的概率。但是这种定义方法存在2个问题:一个是边界值的分类问题,比如24.95 mm的降雨量的归属;另一个是如何计算表示成概率的隶属度,是用隶属度的计算方式还是用概率的计算方式。其实,使用共识定义来构建隶属度,也不一定需要引入概率方法。

可能性理论与概率论在具体运算的定义上也有很多不同之处,比如可能性测度满足F-相加性,而概率测度满足的是相加性而不满足F-相加性<sup>[6-7]</sup>,即

Π(F∪H)=Π(F)∨Π(H)(12)

P(F∪H)=P(F)+P(H)-P(F∩H)(13)

联合可能性<sup>[4]</sup>可以由

π(X,Y)(u,v)=πX(u)∧π(YX)(vu)(14)

计算,也可以由

π(X,Y)(u,v)=π(XY)(uv)∧π(YX)(vu)(15)

来计算。

边缘可能性的计算方式有

πx(u)=∨vπ(X,Y)(u,v)(16)

πx(u)=∨vπ(X,Y)(u,v)(17)

等。

4 BISC中关于可能性理论的最新热点问题

BISC全名the berkeley initiative in soft computing,是世界领先的软计算基础与应用研究中心,核心人物是Lotfi A.Zadeh教授,来自于世界各地的学者参与其中。软计算理论的最新思想基本都在这个项目里诞生,所以其中最新热点问题将引起相关研究者的热切关注。

BISC近期的一个热点问题是“grades of membership and probabilities”即“隶属度与概率”,由Zadeh教授提出,主要探讨者为Boris Kovalerchuk教授和Michael Tschantz教授。

Zadeh教授在2014年2月4号的通信中总结了他对用概率描述隶属度的看法,即共识基础定义的隶属度可以用概率来描述,但主观定义隶属度不可以。考虑在主观定义的环境中,将隶属度描述成概率是否有意义,是否有作用,在共识定义的环境中又如何。Zadeh教授的论点是主观定义环境中用概率描述隶属度没有意义也没有作用;在共识定义环境下,也就是投票模型中,将隶属度描述成概率即为 “随机选择的投票者如此分类”这个事件的概率。将隶属度描述成概率带来更大的复杂性。他于2月6日的通信中补充道,共识定义的隶属度表示并不一定需要概率。

Kovalerchuk教授于2014年2月16日的通信中回应,将某个隶属度0.7表示成概率是有意义的,正如使用“有意义的”这个词的方式。0.7不一定得是共识定义的隶属度也可以是主观分配的。模糊逻辑是一个运算较为简单的理论,但代价是严谨性和相容性的缺乏。模糊逻辑在处理连词时使用的min运算的结果<sup>[8]</sup>与概率比起来是夸大了的,即最小化方法给出了对联合概率的较高估计。

Tschantz教授在2014年2月18日的通信中对Zadeh和Kovalerchuk的讨论作了评论。他认为“概率”这个词的使用是需要条件的,要首先确定是日常用语中的“概率”,还是公理化概率论中所用的术语“概率”。Zadeh认为隶属度是无法用概率描述的,而Kovalerchuk却主张公理化概率论能描述隶属度,Tschantz认为他们之间是因为对“概率”的定义不同,所以才得出了不同结论。他也认为通常意义下的概率是无法描述隶属度的,以“某人喜欢自己的工作的程度为0.7”为例,那么可以将0.7认定为肯定回答“是的”,因此将“某人说‘我喜欢自己的工作’”这个事件的概率定为0.9,而不是概率为0.7。

Kovalerchuk教授在2014年2月18日的通信中解释道,他所使用的“概率”这个词是正规公理化概率论(FAPT)<sup>[9]</sup>中的术语,而不是自然语言中具有模糊意义的词汇。在问卷模型中可以将提问措辞作为FAPT的输入,从而将程度解释为概率。使用 “概率”这个词时,当用的是FAPT中概率的定义时,将隶属度表示成概率就没有矛盾了。他在2月24日的通信中阐述了使用FAPT方式来表示隶属度的好处——可以使隶属度运算过程中使用非常严格正规的概率技巧,是以简单的方式为模糊逻辑增加了严谨性。

Zadeh在2014年2月26日的通信中详细分析了Kovalerchuk的推理方法,并说明Kovalerchuk的方法错误在于,仅仅是将隶属度的数字表达成了概率而并不是将隶属度表示成了概率。当进行隶属度运算时,计算用概率描述的隶属度需要首先假设事件的独立性,但是如何计算、如何证明模糊事件的独立性是个问题。独立本身是个模糊的概念,当独立被依照刚性概念定义的时候会出现连锁推理悖论<sup>[10]</sup>,这也就是传统概率论的严重问题。概率论是基于二价逻辑定义的,而隶属度是基于模糊逻辑的,这也是使用概率来描述隶属度的最大矛盾之处。

这些讨论不但在做着让概率与隶属度相通的尝试,并且是对细节概念的再次探究,讨论过程中理论也在不断变得严谨和深入。

5 结 论

本文主要介绍了可能性分布的定义,可能性测度的定义,可能性理论在软数据推理上的应用,可能性理论研究热点问题。并强调可能性理论的核心在于命题的转化,即是软数据的形式化,通过转化规则将软数据命题转化成可能性赋值等式;使用推理规则和模糊数学运算原理,用形式化后的软数据进行推理。可能性理论目前主要应用于数据处理、决策分析、模式识别和自动控制等领域。相对于概率论可能性理论更加符合人类直觉,所以在对认知性数据的形式化上将会起到巨大的推动作用,也是可能性理论应用的研究热点。

参考文献:

[1]

ZADEH L A. PRUF——a meaning representation language for natural languages[J]. Int. J. Man-Machine Studies,1978(10):395-460.

[2] ZADEH L A. Fuzzy sets as a basis for a theory of possibility[J]. Fuzzy Sets and Systems, 1978(1):3-28.

[3] 陆丙甫, 金立鑫. 论蕴涵关系的两种解释模式描写和解释对应关系的个案分析[J]. 中国语文,2010(4):331-384.

[4] ZADEH L A. Possibility theory and soft data analysis, I and II[M]//COBB L,THRALL R M.Mathematical Frontiers of the Social and Policy Sciences. Boulder:Westview Press Co.,1981:69-129.

[5] 罗承忠. 模糊集引论[M]. 2版.北京:北京师范大学出版社, 2005:272-275.

[6] ZADEH L A. Advances in fuzzy set theory and applications[M]. Amsterdam: North-Holland Publishing Co., 1979.

[7] 盛骤, 谢式千,潘承毅. 概率论与数理统计[M].4版.北京:高等教育出版社,2010.

[8] ZADEH L A. Fuzzy sets[J]. Information and Control, 1965(8):338-353.

[9] 徐传胜. 柯尔莫戈罗夫的公理化理论及其概率思想[J]. 自然辩证法研究, 2010(5):97-102.

[10]杨宁芳. 悖论分类及其产生原因探究[J]. 武汉科技大学学报:社会科学版, 2007(4):361-363.

作者简介:

严 巍(1989),男,南京人,硕士研究生,主要研究方向为智能科学;赵 川(1967),女,副教授,主要研究方向为自然语言理解和智能科学。

Brief analysis of the possibility theory

YAN Wei,ZHAO Chuan

(School of Information Science & Technology, Chengdu University of Technology, Chengdu 610059, P.R.China)

Abstract:The conventional research method of uncertainty is using probability theory and statistical approach, however, there are different kinds of uncertainty in the real world, and the conventional methods can not deal with them. The conventional method merely applies to the uncertainty that is generated by the uncertain conditions. That is, given a certain event, the slight deviation of conditions leads to random occurrence. Another kind of uncertainty is the event has fuzzy factors itself and conventional way is invalid here, and possibility theory is necessary in this situation. This paper states the specific rules and approaches of using possibility theory to deal with soft data which is represented by natural language, compares possibility theory with probability theory and introduces the latest information about possibility theory.

Key words:possibility theory,fuzzy set,soft data,inference from soft data,BISC

推荐访问: 理论研究 可能性

版权所有:智城范文网 2010-2025 未经授权禁止复制或建立镜像[智城范文网]所有资源完全免费共享

Powered by 智城范文网 © All Rights Reserved.。粤ICP备20058421号