登陆注册
78496200000424

第424章 幻当程序员小白用自然语言编程时会怎样?

=数据卡尺=

如何用统计学的知识,来应用在数据上呢?

-第一步-

要弄明白统计学和数据之间的共性和非共性。

统计学:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而统计学本身就有意和无意的忽略了各个数值的先后排列。

数据:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而数据本身很注重各个数值的先后排列。

比如:ABRACADABRA

用统计学来表示,就是A出现了5次,B出现了2次,C出现了1次,D出现了1次,R出现了2次。

用数据来表示,就是ABRACADABRA。

那么如何把数据快速的解压缩出来呢?可以使用分段压缩方式,比如把一个大文件,分割成一个个片段,例如:

ABRACADABRA THE FOX JUMP.张三和李四一起去喝酒。

那么,就可以根据前面的数据,本身就是采用英文的方式,也就是最多是52进制(区分大小写),而后面的中文可就麻烦了,毕竟中文本身进制相当大,那么就需要进行大进制处理。

用统计学的方法,就是把数据平均分,然后分割成可以互相对齐的数据个体,然后统计这些数据个体各出现了多少次。

然后进行统计,把统计数据记录下去。

也就是说,把大英百科全书的纯文本内容用统计学的方式记录下来,就能对应到大小写英文字母+符号+空格+换行+换页……

那么就能够统计出各英文字母出现过多少次,这导致的就是数据能够很好把所有元素给还原出来,只是这些元素之间的排列组合,就随着数据长度的变大而趋向更高运算量。

最简单的方法,就是用三种统计方法:

如字母矩阵:

A C A E F H I O P Q R T T Y T

A S D K F J A S L K F D J L A

S K J F D A S D F S A D F A S

D F A S F A S D F A S F D A S

F D J H L K J H L K J H L K J H

为了快速得知每个数字的排列方式,可以进行统计校验

每一行的第一列中出现A的次数为2次

每一行的第二列中出现A的次数为0次

第一行中出现A的次数为2次

第二行中出现A的次数为3次

A在整个文本中出现过12次

以此类推,就能使用数独的方式,逆推出去掉了很多排列组合的有限数量的排列组合方式,然后这些排列组合就能通过其他校验方式,比如MD5,比如SHA128和其他校验方式快速找出正确的排列组合。

这种方式,就是使用小公式重复使用的方式,快速生成数据的片段,然后只需要把数据片段进行拼图一样的整理就行了,就能还原出源文件。

之前说的,只应用到阶乘,N次方,无理数,都只适合于超级计算机的压缩方式,而这次介绍的,则是相对来说,更适合个人计算机,以及单片机使用,本身就是以硬件上限有限时,如何获得最高压缩率,以及最快解压缩。

同样的,把数据进行片段化,然后使用特定进制的方式来进行统计,同样可以统计出,然而还有一种特殊的进制转换对齐校验方式。

比如二进制的101010111010110111010001001101110010。

转换为4进制(00=A)(01=B)(10=C)(11=D):CCCDCCDBDBABADBDAC

转换为十进制:46,084,723,570

转换为16进制:A BADD 1372

然后进行统计,比如,在4进制中,ABCD各出现过多少次;在二进制中0和1各出现过多少次;在十进制中0123456789各出现过多少次;在十六进制中0123456789ABCDEF各出现过多少次。

当然了,为了进制校验的准确性,一般都是采用素数进制的方式来进行校验(比如2进制,3进制,5进制,7进制,11进制,13进制……以此类推),然后通过进制之间的差异,来统计。

当然了,因为是为了给单片机使用的,所以本身就不会采用过高进制,比如高达亿进制。

也就是把每一个数据片段,都除以各个进制数,然后得出余数。

→喷子兼或破壁人:所以分解质因数都出现了是吧?你还能更敷衍一点么?

→喷子兼或破壁人:直到现在,你都没有给出使用多处理器来进行大数据压缩和解压缩的代码实现,你在这给程序员用自然语言编程呢?

同类推荐
  • 快穿之功德造就金身

    快穿之功德造就金身

    简单粗暴的说,就是快穿文。以后改。第一个世界暂定现代文,霸气十足女神范&外冷内热小学霸
  • 纵横奥特位面

    纵横奥特位面

    一个掠夺者,一条宇宙穿梭的吞噬之路,他究竟是地球上的严浩然,还是紫色虚无空间中的贪婪之神雷杰赫尔?究竟是一个大能的傀儡,还是个中二的青年?敬请期待………
  • 我有一间超神制卡屋

    我有一间超神制卡屋

    这是一个从边陲小城的难民营里开始崛起的故事。“恒哥,我们被困住了,怎么办?”“不着急,我先做张隐身卡。”“恒哥,他们太嚣张了,咱们打不过。”“不怕,等我先修复这种传奇战卡。”“恒哥,我们被大军包围了,兄弟们武器不够。”“等我一晚,明天给兄弟们武装到牙齿。”“恒哥,你制卡怎么这么厉害。”“嘿嘿......”我有一间超神制卡屋呀!
  • 危城生存

    危城生存

    一觉醒来,整个世界都变样了,如何在这个充满了危机的世界中生存下去
  • 破天盛宴

    破天盛宴

    秦风是谁?他是一个勇敢铁血的退伍兵宅男!他在干嘛?正在陷入一场无限的死亡游戏!在这里,秦风常说一句话,怕没有用,干!才是真理!在跟我嚣张,信不信我捶死你!既然如此,那就来吧!反正有美女、有兄弟!既然破天盛宴,那就破了这个天!
热门推荐
  • 星迹无涯

    星迹无涯

    玄珠,黄帝手中的绝世神器!在黄帝飞升后,就消无人间,从此进入到另一个世界中!这个世界——时宙大陆!阳冰,通过梦境来到这个世界。因为机缘,获得曾经黄帝所使用过的神器!曾经的帝王早已离去,而世人顿悟多少往事?星辰若海,此心光明。往事随风,亦复何言......
  • 让开,影后她锦鲤出道

    让开,影后她锦鲤出道

    鹿星葵一直很倒霉。她努力的想退出娱乐圈,偏偏各路前辈争着抢着要给她介绍资源。她努力的作死败坏人缘,狗仔、媒体、营销号就像瞎了一样看不见。她努力的坏别人好事,可别人不是发财就是升官,一个个全都踏破门槛来感谢她。她努力的想败家,直到某天一看银行卡余额,叹气,余额怎么只增不减呢?鹿星葵泪流满面:“好倒霉啊,小丑竟是我自己!”众人:这叫倒霉?老凡尔赛了!-有天,鹿星葵被人调戏时,率先护她的人竟是她处心积虑想要扳倒的死对头。她问出心中疑惑:“你步步为营这么久,难道不是觊觎鹿氏家业?”他说:“我步步为营一心觊觎你,没功夫觊觎你家业。”他还说:“鹿星葵,我想要你一辈子。”
  • 我在异界吃火锅

    我在异界吃火锅

    远方闪动的星辰,再次落入凡间。穿越到异世的少年,竟还想念着吃过的最后一顿火锅。且看一心想着吃火锅的少年,如何在充斥着魔法的异世界里摸爬滚打。
  • 神猿录

    神猿录

    一个孤儿武道修炼者,一个偶尔机会下拥有了能够打破体内先天锁脉的困窘局面的机会,更发现自己那不同常人的奇异出身!噬气造力、魔兽异族、散仙大神,接踵而至,而即将面对他的是什么样子翻天覆地的逆天命运?新书级别说明:武员→武士→武者→武灵→武尊→武宗→武道仙圣
  • 我有一群傀儡玩家

    我有一群傀儡玩家

    山村少年秦凡,偶得奇物游戏空间,从此踏上了一个别有风味的修真之路。
  • 奶崽

    奶崽

    【所有人都知道,颜安生气的时候只要找来星泽就好。】傲娇校草一脸不耐扑进她的怀里:“我才不会喜欢你这个女人。”“哦。”奶狗影帝蹭了蹭她的手心:“姐姐喜欢我嘛。”“哦。”冷血皇帝抿唇抱她的腰肢:“朕允许你喜欢我。”“呵呵。”病娇少年舔了舔刀尖:“姐姐不听话就把姐姐关进小黑屋哦。”“试试谁关谁。”颜安点燃一根烟,拉了拉铁链:“想死一次试试么?”某少年颤颤发抖:“姐姐我错了。”颜安站在尸体堆上,眼里满是冷漠,持剑指着星泽。“离开我。”“姐姐,我爱你。”颜安转头就走,没人发现清冷面孔上隐隐约约的笑意。
  • 西行漫漫之青春有点涩

    西行漫漫之青春有点涩

    一只戴着假发的猪,一只未进化完全的猴子,两人个从一架飞机一起出发,西行三万里路漫漫,来到法国留学取经,历经磨难,相亲相杀,相互温暖,而加上四位美女帅哥和女主一群留在国内的狐朋狗友,这些年轻人,用自己火热的青春谱写了一首酸酸甜甜苦苦辣辣的青涩赞歌
  • 圣洲图

    圣洲图

    从华夏共和国穿越过来的凤春院流影是学生,也是游戏达人,喜欢上了一款全新的手游名为《圣洲图》并知道了里面有游戏代码初始程序,而心仪女生夏晚晴被黑衣人组织给带走了,随后一连窜的神秘事件接踵而至。他能否打开代码救出心仪女生?请和我一同进入小说世界去寻找答案。
  • 说梦忆青春

    说梦忆青春

    小的时候我们都是一群有梦想的孩子,顾倩怡也是,在顾倩怡小时候和柏宇讨论梦想,顾倩怡是当一个医生,柏宇只想成为想他妈妈一样职场强人或者一名警察,当然这只是小时候。柏宇对顾倩怡说,长大了要娶顾倩怡;但是在顾倩怡五岁那年柏宇离开了,曾经在顾倩怡背后扯她辫子的男孩,走了,一句话都没留下;顾倩怡很伤心但是几年以后顾倩怡出了一场车祸忘记了柏宇是谁,她只好从新开始新的生活。
  • 元灵九州

    元灵九州

    天之骄子林梵,本在灵域历练,在离开灵域之时,缺遭到灵域本源的攻击,回到林家后元力大减,但一直在努力修炼,只为了那一个约定……