都市传说吧 关注:88,103贴子:392,046

关于2012吧神贴“二进制”“告知”标题与楼主id的一些见解

取消只看楼主收藏回复

特别感谢@Yurodstvo 大神一起研究这个问题,非常感谢。
近几日又翻到了梦音大神的古早神贴盘点,又对“10111000111001101101011010101010” 这个标题以及楼主的id产生了兴趣与一些疑问,纠正一下网上的错误并分享寻找的过程以及一些疑问。
本贴不对原贴中那些图片的内容做解读,只是单纯研究他的id以及标题可能的含义。
希望懂这方面的大神可以解答一下疑惑,给出更加合理的解释,希望贴子可以起到抛砖引玉的效果。
附原贴链接:10111000111001101101011010101010
以及梦音大神的神贴盘点:『搬运』冰山图中收录的神贴类都市传说原贴链接整理


IP属地:天津来自Android客户端1楼2024-11-19 02:14回复
    先来简单解释一下进制转换以及对应的字节数,一位二进制数占1bit,四位二进制数对应一位十六进制数,1字节(1B)对应8bit,也就是说1字节对应八位二进制数或两位的十六进制数。
    来说说标题“10111000111001101101011010101010”,标题的32位二进制直接转换成十进制(也就是日常使用的进制)对应的值“3102135978”并没有什么实际意义。转换成十六进制为“B8E6D6AA”,可以通过这串十六进制可以尝试各种编码规则,看看有没有想要的结果。


    IP属地:天津来自Android客户端2楼2024-11-19 02:16
    回复
      网上的说法是“主题如果按照二进制转换,成为ASCII之后得出的汉字是告知”
      但稍微试试就知道了,这是错误的说法,ASCII码的定义是:ASCII字符集中的每个字符都使用8位进行编码。最高位通常设置为0,因此实际使用的编码范围是7位,即从0000000到1111111。
      可以轻易看出来,标题并不是ASCII的风格,更不会转成“告知”,故可以判定ASCII的说法是错误的。


      IP属地:天津来自Android客户端3楼2024-11-19 02:17
      回复
        而后又尝试了使用最广泛使用的utf8,utf8能够用1到4个字节表示每个符号,可以实现对世界上几乎所有文字系统的编码,且具有与ASCII码向后兼容的特性,但是,在utf8规则里,通常一个汉字是使用3字节表示,而3字节也就是24位二进制,3位十六进制,标题的32位显然不是它的整数倍,故也可排除。


        IP属地:天津来自Android客户端4楼2024-11-19 02:19
        收起回复
          再尝试了utf16编码规则,utf16的编码规则是大部分常见汉字使用2字节表示,极少数生僻字使用4字节表示,标题的4字节正好是2字节的整数倍,utf16看上去貌似沾边,但满怀期待将其转换后的结果只是“룦횪”这样两个字符,显然这并不是我们想要的结果。


          IP属地:天津来自Android客户端5楼2024-11-19 02:20
          回复
            之后尝试了另一种中文编码规则:GB2312(信息交换用汉字编码字符集),它是1980年颁布的,后续有一步步更新迭代,如1995年颁布的GBK和后来的GB18030,他们都具有着兼容之前版本的特点。
            GB2312编码是定长编码,固定为2字节,并且汉字区表示范围为B0A1~F7FE,会发现标题上的两个字均在表示范围之内,在查询了GB2312对应表后,终于,出现了“告知”这两个字。
            可以正式判定ASCII的说法是错误的,而正确的编码方式是GB2312。


            IP属地:天津来自Android客户端6楼2024-11-19 02:20
            回复
              插句题外话,锟斤拷的成因就是编码之间的互相转换,汉字的常用字符编码是GBK,而utf8编码规则遇到不认识的就会用占位符“�”替换,这个占位符对应的十六进制为“EFBFBD”,两个连着的占位符则是“EFBFBDEFBFBD”,而GBK采用的是2字节定长编码,会将他们拆分成“EFBF”“BDEF”和“BFBD”,这三个字正好对应的就是“锟斤拷”,互联网一大神器就这么诞生了。
              早年间总能发现锟斤拷的身影,而近几年很少能看见了,我觉得这也侧面反映了GBK的没落,已经大面积被utf8取代,我们再也无法回到那个总是出现乱码,用着小水管网络,但又无忧无虑的童年了……


              IP属地:天津来自Android客户端7楼2024-11-19 02:20
              收起回复
                但还有一个更大的问题,这么多年为什么从来没人试着去解读一下楼主的id呢?楼主id是11010010100011,长14位,若是循着刚才的思路,使用GB2312,把不规则的14位在高位补上两位0对应十六进制“34A3”,这显然不在GB2312表示汉字范围内,这是否在表明楼主的id并不是使用GB2312规则呢?对于他的id,我们展开了一系列的推理……


                IP属地:天津来自Android客户端8楼2024-11-19 02:27
                回复
                  剩下的明天更


                  IP属地:天津来自Android客户端9楼2024-11-19 02:27
                  回复
                    由于14位并“不规则”,我们试着将其“补全”成“规则”的16位,常规的补全方法就是在高位补0,但在这里产生了一个疑惑:他为什么不把16位写全呢?
                    或许是受限于早期贴吧id长度上限?但对那个时期的贴吧id规则并不了解,所以就只能用笨方法试了,分为两种可能:
                    ①楼主懂编码,但受限于贴吧id长度限制,只能被迫舍去一部分,试着在高位加上00,01,10,11
                    ②楼主不懂编码,就只是把自己想表示的字转成二进制数,在贴吧id长度限制下缺失了后两位的内容,试着在低位加上00,01,10,11


                    IP属地:天津来自Android客户端28楼2024-11-19 23:04
                    收起回复
                      先从楼主不懂编码角度分析
                      ①在低位加上00,转成十六进制为D28C,使用utf16编码对应的是“튌”,使用GBK编码对应的是“覍”,同武藏坊弁庆的“弁”,指的是一种帽子,不沾边,排除
                      ②在低位加上01,转成十六进制为D28D,使用utf16编码对应的是“튍”,使用GBK编码对应的是“覎”,浙江有个地名“覎口”,不沾边,排除
                      ③在低位加上10,转成十六进制为D28E,使用utf16编码对应的是“튎”,使用GBK编码对应的是“規”,繁体的“规”,而规正好有劝告,规劝的意思!这会是楼主id的实际含义吗?这很有可能,原因在后面会说,先验证其他可能性
                      ④在低位加上11,转成十六进制为D28F,使用utf16编码对应的是“튏”,使用GBK编码对应的是“覐”,同觉醒的“觉”字,也不沾边,排除


                      IP属地:天津来自Android客户端30楼2024-11-20 00:25
                      回复
                        再从楼主懂编码的角度分析
                        ①在高位加上00,转成十六进制为34A3(致敬传奇都市传说猎人34A3先生@Yurodstvo ),使用utf16编码对应的是“㒣”,这亦是一个很有可能的字,原因在后面会提到
                        ②在高位加上01,转成十六进制为74A3,使用utf16编码对应的是“璣”,同玑,不圆的珠子,貌似没什么关系,排除
                        ③在高位加上10,转成十六进制为B4A3,使用utf16编码对应的是“뒣”,使用GBK编码对应的是“矗”,高耸的意思,貌似没什么关系,排除
                        ④在高位加上11,转成十六进制为F4A3,使用utf16编码对应的东西显示不出来,不可名状之物,使用GBK编码对应的是“簦”,是古代有柄的笠,类似雨伞,貌似没什么关系,排除


                        IP属地:天津来自Android客户端31楼2024-11-20 00:41
                        回复
                          目前能想到的楼主id有三种可能的含义
                          1.㒣
                          2.規
                          3.蛊卦
                          我来阐述一下第二种“規”有可能的原因,剩下两种可能的原因将由传奇都市传说猎人34A3先生说明,再次感谢大神@Yurodstvo


                          IP属地:天津来自Android客户端34楼2024-11-20 08:51
                          回复
                            規是规的繁体,在字典里能查到“劝告”的意思,这和标题的“告知”意义相近
                            但看了他在贴子里的内容,感觉这是一个懂玄学的人,没理由不懂编码规则与二进制,因此我们推测会是这么一种情况:他注册时id写的是1101001010001110,但因为长度受限,被系统或他自己删去了低二位,通过计算机知识我们可以知道,如果一个编码的高几位是0的话,往往会被省略,出现不足4的整数倍位的情况,但这种省略方式是建立在他自己主观省略高位的情况下,而在系统中被省略的只会是低位,因此才有了这个猜测。
                            这个字是使用GBK解码出来的,而标题是使用“GB2312”解出来的,这说明他们之间编码形式不一样吗?答案是否定的,因为GBK编码相当于GB2312编码的进化版,它对GB2312是完全兼容的,也就是说在GB2312里的编码也在GBK中,因此可以说标题也是GBK规则解码出来的,如果楼主id想表达的是“規”,那么id和和标题都使用同样一种编码模式也就更合理了。
                            最后一点,也是我们认为堪称“决定性证据”的一点,我们浏览了一下他贴子里的内容,发现他貌似并不是一个繁体使用者,原因是p1p2中的“线”和“画”字都没有使用繁体(但是线字写的很奇怪,右半边像是曳),但是,在p3中,我们发现了“现实”二字使用了繁体,而“現”字的右半边,不正是和“規”的右半边刚好完全一样吗!一个非繁体使用者但在这两个字的使用风格上如此一致,很难想象这真的只是巧合
                            当然,在原贴楼主出来公布答案之前,这一切都只能算是猜测,接下来将介绍剩下两种猜测




                            IP属地:天津来自Android客户端35楼2024-11-20 10:00
                            收起回复
                              剩余部分由@Yurodstvo 大神完成,非常感谢,实在是太专业了,自愧不如
                              在高位补0是几种补位法中唯一正确,也是当年(2012)就有人提出的(我对11010010100011大神的理解
                              补零转十六进制后为34A3,在utf16查找后得到汉字“㒣”(ying4)
                              得到这个生僻字令人疑惑,因为几乎所有网络词典都找不到对应解释(幽 灵 汉 字)
                              直到我翻到了这条:
                              应钟, 古乐十二律之一。比“ 应钟”低八度记为“ 㒣钟”
                              在维基词典“十二律”条目中亦有记录(2022年添加)
                              (以“㒣 八度”为搜索关键词,可以得到更多信息,但对具体低八度/高八度有分歧(b站文章《Unihan漫谈【2】工尺谱和十二律》),甚至在一个/两个八度上也不能统一)
                              不管怎样,“㒣”是一个与十二律应钟有关的字
                              应钟代表什么?《汉书·律历志上》:“应钟,言阴气应亡射,该臧万物而杂阳阂种也。位於亥,在十月。”应钟象征着万物闭藏,为新的春生蓄积能量。
                              强行解释的话,楼主用“㒣”做id是为了告诉网友2012不是末日而是新生。
                              ---
                              可能性分析:楼主在2012年有可能接触到相关信息吗?(如果不考虑纸质资料的话,毕竟上述链接没一个注明文献出处,有点像互相转载)
                              2001年“㒣”所属的Unihan拓展区A被添加至Unicode。根据叶典网(怀疑为八度说法在网上的起源)自2006建站,2015年增加扩展E,可以推测楼主在2012年是有可能完全通过网络接触到这个字的
                              ---
                              至于为什么不直接用“应”,“㒣”是强相关于音律学的,但“应”作为常用字很难直接令人联想到这方面


                              IP属地:天津来自Android客户端42楼2024-11-20 16:28
                              回复