天津麻将协会出版的《国标麻将教程》中提出了一个评价番种难易程度的难度系数,这个难度系数等于特定牌占有率与限定牌占有率之比,以大四喜为例,全部牌共144张,该番种限定使用的牌共16张,需要使用的牌共12张,则限定牌占有率=16/144=0.111,特定牌占有率=12/16=0.75,难度系数=0.75/0.111=6.75。
但是教程中也指出,对于特殊牌型组合的番种,这个系数会明显偏低,例如,九莲宝灯的难度系数仅1.56,与全大和清一色相同,这是明显不合理的。
既然牌型组合很重要,那么我觉得可以使用番种出现的概率来度量番种的难度,计算出该番种的组合数和随机选牌的组合数就可以得出,二者的比就是概率。
但是这同样会得出碰碰和与四暗刻难度相同的不合理结论,还需要考虑副露的影响。鉴于刻子可以从三家碰牌或自摸,顺子可以从上家吃牌或自摸,对于可以碰牌也可以自摸的刻子,每存在一组就将概率翻4倍;对于只能碰牌的刻子,每存在一组就将概率翻3倍;对于可以吃牌也可以自摸的顺子,每存在一组就将概率翻2倍;对于只能吃牌的顺子或不能副露的顺子和刻子,不做改动。
为简化计算,花牌不参与组牌;和牌时可能存在的放大系数也不计;除了杠系列的番种外,所有的刻杠都按照刻子来计算,不考虑杠牌的情况。
考虑到得出的概率极低,为方便对比,对这些概率全部取对数,于是产生了一个评价番种难度的难度指数,公式如下:

这里面的随机组合数和番种组合数可以有两种理解,以大三元为例,一种是只考虑组牌,即从136张牌中随机选取9张牌,计算随机组合数和拥有中发白三组刻子的番种组合数,这样算出来的暂时称作组牌难度指数;另一种是考虑和牌,即从136张牌中随机选取14张牌,计算随机组合数和拥有中发白三组刻子且满足和牌牌型的番种组合数,这样算出来的暂时称作和牌难度指数。对于清一色、全不靠、七对这类全体属性番种,两种难度指数的值是一样的;对于大四喜、大三元这类只关注特定数量的面子的番种,组牌难度指数一般会比和牌难度指数高0.3~0.6。
以字一色为例,演示一下难度指数的计算过程:
字一色是全体属性番种,随机组合数为C(136,14)≈4.25×10^18。字一色有四刻一将和七对两种和牌方法,四刻一将的牌型共有C(7,4)×[C(4,3)]^4×C(4,1)×C(4,2)=161280种组合,四组刻子均可以碰牌或自摸,则副露系数为4^4=256;七对的牌型共有[C(4,2)]^7+C(7,1)×C(6,5)×[C(4,2)]^5+C(7,2)×C(5,3)×[C(4,2)]^3+C(7,3)×C(4,1)×C(4,2)=
652728种组合,七对不能副露,则副露系数为1。
字一色番种的难度指数=lg(4.25×10^18÷(161280×256+652728))=11.01。
下表是我计算出的部分国标麻将番种(共50种)的难度指数。对于高分番种,番种组合限制较多,计算比较容易,很多都能算出组牌难度指数和和牌难度指数,但对于组合限制较少的低分番种,就很难计算和牌难度指数了。

注:绿一色、清一色、全大、全中、全小、全带五、大于五、小于五、推不倒、混一色等,本人精力有限没能算出难度指数,有兴趣的可以电脑编程一下试试,个人估计,绿一色大概在10.5~11之间,清一色大概在9~10之间。
这个表格的数据得出了一些有点意外的结论,比如双暗杠和十三幺难度接近,双明杠和小三元难度接近,这两组番种在我们平常讨论中基本都是不可能相提并论的。表格中的频率指数是我在雀渣平台上查询的该番种出现频率的负对数,比如七对一共出现69065次,平台总计共2186059盘,则频率指数为lg(2186059/69065)=1.50。
下图是上表中50个番种的组牌难度指数-频率指数散点图。

从图上可以看出组牌难度指数和频率指数基本呈线性相关,相关系数高达0.96。基本可以认为组牌难度指数这个照表是合理的。
但是教程中也指出,对于特殊牌型组合的番种,这个系数会明显偏低,例如,九莲宝灯的难度系数仅1.56,与全大和清一色相同,这是明显不合理的。
既然牌型组合很重要,那么我觉得可以使用番种出现的概率来度量番种的难度,计算出该番种的组合数和随机选牌的组合数就可以得出,二者的比就是概率。
但是这同样会得出碰碰和与四暗刻难度相同的不合理结论,还需要考虑副露的影响。鉴于刻子可以从三家碰牌或自摸,顺子可以从上家吃牌或自摸,对于可以碰牌也可以自摸的刻子,每存在一组就将概率翻4倍;对于只能碰牌的刻子,每存在一组就将概率翻3倍;对于可以吃牌也可以自摸的顺子,每存在一组就将概率翻2倍;对于只能吃牌的顺子或不能副露的顺子和刻子,不做改动。
为简化计算,花牌不参与组牌;和牌时可能存在的放大系数也不计;除了杠系列的番种外,所有的刻杠都按照刻子来计算,不考虑杠牌的情况。
考虑到得出的概率极低,为方便对比,对这些概率全部取对数,于是产生了一个评价番种难度的难度指数,公式如下:

这里面的随机组合数和番种组合数可以有两种理解,以大三元为例,一种是只考虑组牌,即从136张牌中随机选取9张牌,计算随机组合数和拥有中发白三组刻子的番种组合数,这样算出来的暂时称作组牌难度指数;另一种是考虑和牌,即从136张牌中随机选取14张牌,计算随机组合数和拥有中发白三组刻子且满足和牌牌型的番种组合数,这样算出来的暂时称作和牌难度指数。对于清一色、全不靠、七对这类全体属性番种,两种难度指数的值是一样的;对于大四喜、大三元这类只关注特定数量的面子的番种,组牌难度指数一般会比和牌难度指数高0.3~0.6。
以字一色为例,演示一下难度指数的计算过程:
字一色是全体属性番种,随机组合数为C(136,14)≈4.25×10^18。字一色有四刻一将和七对两种和牌方法,四刻一将的牌型共有C(7,4)×[C(4,3)]^4×C(4,1)×C(4,2)=161280种组合,四组刻子均可以碰牌或自摸,则副露系数为4^4=256;七对的牌型共有[C(4,2)]^7+C(7,1)×C(6,5)×[C(4,2)]^5+C(7,2)×C(5,3)×[C(4,2)]^3+C(7,3)×C(4,1)×C(4,2)=
652728种组合,七对不能副露,则副露系数为1。
字一色番种的难度指数=lg(4.25×10^18÷(161280×256+652728))=11.01。
下表是我计算出的部分国标麻将番种(共50种)的难度指数。对于高分番种,番种组合限制较多,计算比较容易,很多都能算出组牌难度指数和和牌难度指数,但对于组合限制较少的低分番种,就很难计算和牌难度指数了。

注:绿一色、清一色、全大、全中、全小、全带五、大于五、小于五、推不倒、混一色等,本人精力有限没能算出难度指数,有兴趣的可以电脑编程一下试试,个人估计,绿一色大概在10.5~11之间,清一色大概在9~10之间。
这个表格的数据得出了一些有点意外的结论,比如双暗杠和十三幺难度接近,双明杠和小三元难度接近,这两组番种在我们平常讨论中基本都是不可能相提并论的。表格中的频率指数是我在雀渣平台上查询的该番种出现频率的负对数,比如七对一共出现69065次,平台总计共2186059盘,则频率指数为lg(2186059/69065)=1.50。
下图是上表中50个番种的组牌难度指数-频率指数散点图。

从图上可以看出组牌难度指数和频率指数基本呈线性相关,相关系数高达0.96。基本可以认为组牌难度指数这个照表是合理的。