优止论及稳定婚姻问题对资本市场建设或有启发 目录 本文的思想是不成熟的,本人没有能力探究,不知道想法如何,倘有点价值,但愿能抛砖引玉。最初是在看耶鲁大学JohnGeanakoplos的网上公开课FinancialTheory(OpenYale Courses 2009)产生的想法,第16课提到最优止时理论,从而有了本文的思考。附带提一下,同为耶鲁的RobertJ. Shiller的公开课FinancialMarkets,也值得推荐。 本文分为4个部分,均可独立阅读,无先后顺序之分,不点序号。 优止论(OptimalStopping Theory,OST,最优止时理论)是实用性非常强的学科,有很多类型的问题,这里举出常见的2种,红黑抽牌游戏、秘书问题。 稳定婚姻问题(StableMarriage)同样具有很强的实用价值。 这类问题与资本市场中的证券交易、风险投资与融资等非常相似,值得仔细玩味,对二级市场交易策略、一级投融资、基金管理、企业融资,乃至对交易机制设计、规则制定都会有所启发。 以秘书问题为例,秘书问题能帮助解答如下的困境。 假如你要卖掉一套房子,每个意向购房人报出的价格都不一样。如果把房子卖给第1个意向买房人,就丧失了与后续意向买房人交易的机会,而他们可能出价更高。如果拒绝了第1个人,等待第2个意向买房人,他的报价也可能更低。在等待的过程中,你可能需要为没有卖出的这套房子缴纳房贷、物业费等费用。立即卖掉能帮你节约开销,但不能保证出手后的净收益最高。何时停止等待能使净收益最高呢? 在房价没有明显的上涨或下跌趋势的前提下,假定意向购房人的报价是随机的,而你打算接触n个意向购房人。 (1)如果想获得n个意向购房人中的最优报价,你只需要拒绝前37%*n个意向购房人、接受此后第一个比前37%*n个报价都更优的报价,采取这种策略,你获得最优报价的概率是37%; (2)如果不再追求最优报价,只要是n个意向购房人中前5%的高价即可,那么,需要拒绝的意向购房人不再是前37%*n,而仅为前22%*n,采取这种策略,你获得前5%高价的概率上升到57%; (3)若再宽松一些,放宽条件至前15%的高价,则仅需拒绝前19%*n,成功率则涨到78%,已相当令人满意。 上述答案隐含了假定,即意向购房人比较踊跃、成效迅速,持有物业的房贷、物业费等费用被忽略了。 以下逐一介绍红黑抽牌游戏、秘书问题和稳定婚姻问题。 红黑抽牌游戏 设有一洗牌充分的扑克牌,抛弃其中的大小王,每次从剩下的52张纸牌中抽出一张,抽到红牌,赢1元,抽到黑牌,输1元。问何时该停手? 显然,最坏也不会输钱,因为可以将游戏进行到最后,抽光全部纸牌,结果是0。开头运气越好,抽到的红牌越多,意味着后面黑牌越集中,想不输钱越难。开头运气越差,后面越可能赢钱。这说明游戏的结果与剩下的纸牌直接相关。在总体牌面已知的条件下,可通过已抽出的纸牌了解剩下纸牌的情况。 可采用递归的方法,从终局往前推算(BackwardInduction,逆向归纳)。 假定只剩1张纸牌。 由于其他纸牌都已被抽出,所以,我们知道剩下的牌是什么颜色的。 如果是黑牌,意味着此前已抽出26张红牌和25张黑牌,盈余1元,抽出剩下的最后1张黑牌,将带来损失,因此,停止抽牌,期望为1元。 如果是红牌,意味着此前已抽出25张红牌和26张黑牌,亏损1元,抽出剩下的最后1张红牌,可弥补亏损,期望为0。 推广这个结果。 假如剩下的2张、3张、……、n张纸牌都是黑牌(Black),意味着已抽出所有红牌,盈余n元,应停止游戏,期望为n元。 假如剩下的2张、3张、……、n张纸牌都是红牌(Red),意味着已抽出所有黑牌,亏损n元,应继续游戏,期望为0。 以E(b,r)(按首字母排序)表示剩下b张黑牌、r张红牌时的期望。上述结果表示为E(n,0)=n,E(0,n)=0。 再来考虑更一般的情况。 先来看剩下2张纸牌。剩下2张同色的上已讨论,更一般的是1黑1红,即E(1,1),分别有1/2概率抽到黑牌或红牌。 假如抽到黑牌,输1元,应继续抽剩下的1张红牌,期望为0。 假如抽到红牌,赢1元,应停止抽剩下的1张黑牌,期望为1元。 因此,E(1,1)=1/2*E(0,1)+1/2*E(1,0)=1/2*0+1/2*1=1/2元。 再来看剩下3张纸牌。除上已讨论的同色外,有1黑2红,2黑1红。 1黑2红,已亏损1元。 (1)若抽到黑牌,输1元,应继续抽剩下的2张红牌,期望为0。 (2)若抽到红牌,赢1元,盈亏相抵,剩下1黑1红,期望为0.5元。 即,E(1,2)=1/3*E(0,2)+2/3*E(1,1)=1/3元。 2黑1红,已盈利1元。 (1)若抽到黑牌,输1元,盈亏相抵,剩下1黑1红,期望为0.5元。 (2)若抽到红牌,赢1元,应停止抽剩下的2张黑牌,期望为2元。 即,E(2,1)=2/3*E(1,1)+1/3*E(2,0)=1元。 依此类推,可得下表。 剩余纸牌组合为(b,r)时的预期盈亏Pe(b,r)(实际盈亏和期望,绿色、粉色区域表实际盈利,为整数,其余区域盈利小于期望,故为期望值)。 一旦剩下纸牌的组合(b,r)处于表中绿色和粉色区域,即可停止,若仍继续,再次触及粉色边界即应停止。 在绿色、粉色外的其他区域,盈亏小于期望,仍应继续。 在游戏开始时的Pe(26,26)=2.62,只要有这样的游戏,就应该参与,爱拼才会赢。 此外,剩下的纸牌数量越少,期望越低,可见,人生拼搏要趁年轻,机会越多,成就越大。
回到问题,采用递归方法,可推广到剩下b、r张纸牌的情况,此时期望为 剩b、r张纸牌时,意味着已抽取n-b张黑牌、n-r张红牌,实际盈亏Pa为 将剩下b、r张纸牌时的实际盈亏Pa与期望相较,可得到预期盈亏Pe,以决定是继续还是停止。Pe为当前实际盈亏情况(b-r)与上述期望的最大值。 上述红黑抽牌游戏,与即将退市的证券有不少相似之处,退市前剩余的有限交易日对应于限定的抽牌回合,涨跌幅限制对应于红黑牌损益,这对持有退市证券的投资者在有限交易日内如何退出可能有所启发。 秘书问题 秘书问题(SecretaryProblem),又称择偶、雇佣、见好就收问题等,出现于统计观测序列分析(Wald,1945),Arrow、Blackwell和Girshick(1948)、Snell(1952)做出阐述,YuanShih Chow(周元燊)、Robbins在1961和1963年的论文引发了对该问题的新兴趣,并推动了优止论的迅速发展。 典型秘书问题是,已知有n个申请人应聘某一秘书职位;申请人间有优劣之分,且无不分伯仲的情况;依次面试,顺序随机,各顺序可能性相等;每次面试后,申请人都会被录取或拒绝;接受或拒绝申请人的决定只能基于迄今为止面试的申请人的相对优劣;被拒绝的申请人不能被召回。问采取什么策略,使「『选出的申请人(applicant)』是『最适合秘书职位的候选人(candidate)』」的机率最大? 由于n个申请人各自独立,顺序随机,这与红黑抽牌游戏不同,过去发生的事情与未来没有关联,过去不能提供未来的信息,如同看后视镜开车。 假定策略为,选定一个r(0≦r≦n),拒绝前r个申请人,从r+1个开始,录取此后第一个比前r个更好的申请人(不一定是第r+1个申请人)。 设第k个申请人(1≦k≦n)是最佳候选人。 如果k≤r,即最佳候选人(即第k个申请人)在前r个申请人之中,采取此策略就选不到最佳候选人,即P(r)=0(k≤r)。 如果k>r,最佳候选人(即第k个申请人)在第r+1个或r+1之后的申请人中。此时,如果从第r+1个到第k-1个申请人(r+1,r+2,…,k-1)都不如前r个申请人中的最优申请人,因为接下来的第k个申请人是全部n个中的最佳候选人,自然优于前r个申请人中的最优申请人,由此可选到最佳候选人。 换句话说,k>r时,第r+1个到第k-1个申请人中,若没有出现优于前r个申请人中的最优同时劣于第k个最佳候选人的申请人,即「前k-1个申请人中的最优申请人」是『前r个申请人中的最优申请人』,则可选到最佳候选人。 「前k-1个申请人中的最优申请人」是『前r个申请人中的最优申请人』,即,『前r个申请人中的最优申请人』也是『前k-1个申请人中的最优申请人』,此概率为 因为每一申请人出现在任一位置的机会是一样的。 使用上述策略选到最佳候选人的概率记为P(r),根据条件概率P(第k个是最佳且被选中)=P(第k个被选中|第k个是最佳)*P(第k个是最佳),有, 「第k个申请人是最佳候选人」的概率是1/n;「『前r个申请人中的最优』是『前k-1个申请人中的最优』」的概率为r/(k-1)(k>r)。 k可能出现在1到n中的任一位置(1≦k≦n),因此需要进行加总, 前r个申请人被排除,因此该部分概率为0(k≤r时)。
得最佳的r=n/e=0.3679n,e≈2.71828 1828,为自然常数。 采取此策略选中最佳候选人的概率为 上式中对数为负数,故概率略小于1/e。 对典型秘书问题各条件的变化,会得到很多有趣且有意义的变种。比如,不再追求最佳候选人,只要是排名前5%的候选人即可,那么,需要拒绝的申请人不再是前37%,而仅为前22%,成功率上升到57%;若再宽松一些,放宽条件至排名前15%,则仅需拒绝前19%,成功率则涨到78%,令人满意。 典型秘书问题有个启发,最快出现的成交(时间优先)未必是最优交易。 在交投活跃的市场,按价格优先、时间优先的原则连续竞价(ContinuousBidding)是合适的。连续竞价可以是指令驱动的,也可报价驱动。报价驱动,即由做市商报价,买卖双方都以做市商为交易对手。三板即采取这种方式来活跃交易。 交易中断较长时间后的交易重启(早盘开盘),或交易即将中断较长时间(下午盘收盘)之前,采用的集合竞价(CallAuction),是指令驱动的交易机制。早盘和下午盘隔着1.5小时的午休,时间较短,下午盘开盘不采用集合竞价。连续竞价和集合竞价分别对应连续交易和定期交易两种不同的交易机制。连续竞价的成交价随时间变化,集合竞价只产生一个成交价格。 在像三板、四板一类成交冷淡的市场,有些股票1周甚至1月的成交量都比不上一些股票1天的成交量。换句话说,对于交易冷淡市场的证券,1周甚至1月的成交时间,才相当于交易活跃市场的1天。那么,在交易冷淡的市场,是否可以更长的时间,比如1周、半月、15个交易日、1月等,来组织定期交易?定期交易是否可以有多个成交价格呢? 在投资者适格的前提下,参与冷淡市场交易的投资者,对流动性不足是存有预期的,即对较长的头寸持有时长有预期,这一点和恋爱、婚姻关系相似。除应分层外,也许需要考虑不同的交易机制,在顾及交易效率的同时,也兼顾交易效果,以更好地保障投资者利益,提供参与积极性。 招聘可以凭感觉,谈恋爱可以靠荷尔蒙,投融资一般都会慎重很多。考虑一下在恋爱、婚姻过程中的匹配。在交易冷淡的市场,是否可以让投资者设定匹配等待期,比如,对于不限价(限交易手数或交易总额)的买单,匹配此后100笔卖单中第37笔后的最低价,而不是按价格优先、时间优先来匹配交易? 像买房一样,真正成交前并没有明确的标的物业,仅有大致预期。那么,是否可以方便投资者通过某些方式建立证券池,在交易匹配时,不单在交易价格上给予区间自由度,同时,在交易标的上,也可通过证券池赋予一定的自由度,即,通过交易机制设计,达到类似基金的资产配置效果? 是否可以在交易匹配后,设定一定时长的交易静默期,在静默期结束后,给予投资者对已匹配未成交的交易予以确认或反悔撤回的权利?当然,需要相应的奖惩机制以防恶意报价。这也可作为上述不限交易标的机制的配套。 毕竟,面对数以万家标的,如果可以通过企业实际控制人的星座、血型来选择,对于选择困难症患者、密集恐惧症患者,无疑是一大福音。毕竟,密集的不是钞票,而是股票,产生恐惧是应得到理解和同情的。 典型秘书问题的另一个变化,是已知最佳候选人。 设一有N回合的游戏,每一回合,游戏管理员将在奖金区间[0,R]元内随机抽取一金额作为该回合奖金。此时有两个选择:接受奖金并结束游戏,或者拒绝奖金并进入下一回合。作为例外,若在最后一回合(第N回合),则没有选择,该回合随机抽到什么,即得到什么。对此游戏,什么策略最好? 求解如下。 显然,若抽奖是R,自然应接受。若是0,则拒绝(除非最后一回合)。奖金取决于停止抽奖前的最后一回合抽出的数额,所以,当且仅当某回合奖金不低于某个阈值时,停止游戏,接受奖金离场。这个阈值与剩余回合数有关。 在每一步中,奖金都是从区间[0,1]中独立、随机、均匀地抽取的(这里以R元为单位,因此不必在计算中携带R的因子)。 假定游戏还剩n回合(0≤n≤N,这里n是由后往前数),若奖金不低于阈值则停止,否则继续,此时则剩n-1回合。令Pn为剩余n回合时的阈值,E(n)为剩余n回合时的奖金预期,剩余n回合随机抽出的奖金为Xn,构成集合X。 剩下n回合时,有两种可能: (1)Xn≥Pn,应停止。因奖金在区间[Pn,1]上独立、随机、均匀分布,故,概率为1-Pn,期望为E[X│X≥Pn]=(1+Pn)/2。 (2)Xn<Pn,应继续。因奖金在区间[0,Pn)上独立、随机、均匀分布,故,概率为Pn,期望为E(n-1)(剩余n-1回合的期望值)。 根据期望的定义,剩下n回合的期望是上述两个可能对应的报酬与发生机率的乘积之和, 当Pn=E(n-1)时,期望最大,代入上式, 这是递归表达式。在n=0即剩下0回合的情况下,P1=E0=E(X)=1/2。 令PNn、PDn分别表示Pn的分子(numerator)、分母(denominator), 根据上述递归式即可展开推算, 对于较大的n,一个很好的近似是Pn≈1-2/n,误差为O(1/n^2)。 上述秘书问题的变种,也与退市证券相似,已知最佳候选人可对应于涨跌停板限制,限定回合次数可对应于有限交易日(如退市)、基金存续期等。 稳定婚姻问题 设有n名单身男子和n名单身女子,每人均对所有异性有一由1至n的喜爱顺序排序(基数序且各不相等,或序数序且严格全序),喜爱顺序依次递减,1示最爱,n表最恶。问如何安排出n对情侣,使得不存在两个非伴侣的异性对彼此的评价比对各自现有伴侣的评价还要高,即稳定婚姻。 对此问题,美国数学家DavidGale和LloydShapley在1962年发明了一种寻找稳定婚姻的策略(又称“延迟认可算法”),并证明了稳定的婚姻搭配总是存在的。此策略的应用比提出更早,美国在1952年就使用这种策略给医学院的学生安排工作,称为“全国住院医师配对项目”,当时并不知道这样的流程可保证工作分配的稳定性,只是凭直觉认为这是很合理的。 在该GS策略中,男子将分回合地追求他中意的女子,女子可以选择接受或者拒绝她的追求者。 第一回合,每个男子都向自己名单上排在首位的女子表白。 女子可能面对的情况有以下3种: (1)无人向她表白,则什么都不用做,继续等待; (2)仅1人向她表白,接受该表白,答应暂时和他做男女朋友; (3)多于1人向她表白,则从所有追求者中选择自己最中意的那一位,答应和他暂时做男女朋友,并拒绝其他所有的追求者。 第一回合结束后,有些男女已经匹配,有些仍单身。 第二回合,每个仍单身的男子都向自己名单上所有未拒绝过他的女孩中最中意的女子表白,无论该女子是否单身。和第一回合一样,女子需从表白者中选择最中意的一位,拒绝其他追求者。此时,若某女子已有男友,但遇到更合意的追求者时,须拒绝现男友,投向新追求者的怀抱。第一回合结束后,有些单身男女将获得匹配,有些原已匹配的男女也可能会分手,重返单身。 此后每一回合,单身男子继续追求自己名单上所有未拒绝过他的女孩中最中意的女子,女子则从包括现男友在内的所有追求者中选择最好的一个,并对拒绝其他人。回合不断开展,直至所有人都获得匹配,从而不会有新表白发生,整个过程自动结束。此时的婚姻搭配就一定是稳定的。 以4男4女为例。取春夏秋冬给女子命名,取「礼义仁智信,温良恭俭让,忠勇孝悌廉」前4字给男子命名。各男女的偏好如下,喜爱递减。 春(礼,智,仁,义);礼(秋,冬,夏,春); 夏(礼,义,仁,智);义(秋,夏,冬,春); 秋(礼,仁,智,义);仁(春,秋,冬,夏); 冬(义,礼,智,仁);智(夏,冬,秋,春)。 下图为男子(礼义仁智)主动表白情形下匹配回合的详细过程。 男子主动表白的情况下,结果为:春仁,夏义,秋礼,冬智。 为表征各人的受欢迎程度,对任一人在异性中的排序,令在任一异性中排在最末为1,次末为2,依次往前推,将各人在异性中的排序中加总,以估计各人受异性欢迎的程度。比如,礼在春、夏、秋中均排第1位,在冬中排第2位,则礼受欢迎程度为4*3+3*1=15。 将匹配后对方在其喜爱顺序上的排位作为满意度的表征,如仁在春的喜爱顺序上排第3,春在仁的喜爱顺序上排第1,春对春仁配的满意度为3,仁对春仁配的满意度为1。满意度的加总不一定具有意义,但也能说明一定的问题。 男子主动表白的结果如下表。各人的受欢迎程度标注于各人名后括号内。 可见,男子作为主动表白的一方,其满意度之和为6,小于女子之和9,这意味着主动一方满意度较高,更容易得到好姻缘。 若女子主动表白,结果如何? 若改为女子(春夏秋冬)主动表白,其结果与男子(礼义仁智)主动表白相同,但回合数增加了,这并无普适性。 事实上,本案中男女只是符号,若把春夏秋冬设为男名、礼义仁智设为女名,上述男子(礼义仁智)主动表白的过程,就成了女子(礼义仁智)主动表白的过程。 下图为女子(春夏秋冬)主动表白情形下匹配回合的详细过程。 秘书问题与稳定婚姻问题的联系 如果是男女均主动的策略,会如何呢? 在第一回合,男女双方均主动向第1顺位的异性表白。 任一男女均可能出现以下3种情形: (1)没有收到任何表白,若其向他人的表白被接受,则配对;若其向他人的表白被拒绝,则等待参与后续回合。 (2)仅收到1个表白,若其向他人的表白被接受,则拒绝收到的表白,除非该表白来自其所表白的人;若其向他人的表白被拒绝,则接受收到的表白。 (3)收到多于1个表白,若其向他人的表白被接受,则拒绝收到的所有表白,除非该表白来自其所表白的人;若其向他人的表白被拒绝,则接受顺位最前的异性的表白。 这种策略不能保证全部匹配,即便全部匹配,也可能出现不稳定的情形,即某两对男女中各有一方均认为另一对的异性比自己当前的姻缘更好。 下图为男女均主动表白且配对后不追求更优情形下匹配回合的详细过程。 下图为男女均主动表白且配对后仍追求更优情形下匹配回合的详细过程。 若男女双方均主动表白且配对后不追求更优,在第1回合即可完成匹配,结果是:春仁、夏智、秋礼、冬义。 夏智的姻缘中,夏更愿意与义匹配;在冬义的姻缘中,义也更愿意匹配夏。夏、义均不乐意而希望交换,冬、智则更满足现状且不愿意改变。允许夏、义私奔,可提升夏、义的满意度,但同时降低了冬、智满意度。 本案中,若男女均主动表白且配对后仍追求更优,结果与男子主动表白同,同样,结论不具有普适性。 在不稳定的婚姻中,是继续追求更喜爱的配偶,还是选择继续牵着已经牵了的手安定下来,同样是前文述及的秘书问题、已知最佳奖金的有限回合抽奖问题。这是秘书问题与稳定婚姻问题的一个联系。 在稳定婚姻问题中,匹配的双方数量是固定且相等。这在持续报价且发生交易的市场中并不适用,对于聚焦若干行业的风投,情况可能会相近一些,行业内的企业数量在调查精力范围内,还是有限的。 交易是资源的匹配或置换过程,假如经过交易,使总体效用或需要保护的利益变得更优,那么,该交易就应得到鼓励,无论其创造的是使用价值(原生价值)还是交换价值(次生价值)。 促进有益的交易要建设交易平台、降低交易成本(包括控制交易风险)。 网约车是出行供需交易的平台,是典型的双边市场。双边市场的一个突出特点是,一方的规模效应、网络效应越明显,会吸引越多的对手方参与交易,这又反过来刺激更多的一方参与。在平台建设初期和发展过程中,需要考虑双边建设的先后节奏和平衡。 例如,网约车平台是先吸引车,还是先吸引乘客?车太多乘客太少、车太少乘客太多,都会导致大量交易无法达成,久而久之,平台就难以建成、活跃。电商平台也是如此。 资本市场也是这样的双边市场。从90年代初少量股票的初期交易所到如今的科创板及交投冷清的新三板,从正反两面可以看到,资金是资本市场双边中的关键一边,QFII、沪港通、深港通、纳入MSCI指数等都是在资金边的努力。 抓住主要矛盾及相互作用的矛盾中的主要方面,体现在互联网平台经济中,即是流量思维。人口众多是资源禀赋,有巨大优势的同时,也有巨大劣势。正是因为人口的资源禀赋,才使得中国互联网发展迅猛。天才和精英的出现,依赖于巨大的人口基数,巨大的人口基数同时还提供了市场。社交、娱乐是人们的普遍精神需求,社交平台、娱乐平台掌控着流量,正如资本市场抓住了资金。 信息的采集和处理,是资本市场中重要的交易成本。正如人们置业,选定区域后需要大量时间看房、比较,这是可观的交易成本。但在资本市场甚至如炒币、炒鞋、炒裙等中,多数投资者并不具备类似这样对证券或标的进行调查的能力,遂放弃调查,手续费反而成为主要交易成本。 优止论和稳定婚姻问题,或许能为信息的处理提供较为简捷的方法,给交易机制创新带来启发,进而降低交易成本、控制风险、提高稳定的收益,促进有益的交易。
|