标签归档:河北秦皇岛网络营销,微信SEO,竞价SEM,视频营销,软文营销

我们终将沦为无价值的群体_河北秦皇岛魏汝要SEO自媒体

对于老罗2017年初立捧的《未来简史》,最开始我是无感的,觉得无非是讲无人驾驶,大数据,人工智能等一些老生常谈的内容。但有一次工作日晚上,我下班准备坐地铁2号线回家,路过星巴克买了一杯馥芮白,偶然间却看到门前的一个男生敲着代码,电脑旁边是一本翻开的黑皮的未来简史。 付完账拿到咖啡,从后门出去的时候,又看到了一名女生,喝着咖啡,拿着笔在一本书上做笔记,没错,也是未来简史。 在一家星巴克,晚上10点,寥寥无几的人流里,两个互不相识的不同行业的人,都在翻看同一本书。 从那一刻起,我确切的发现这本书潜藏的影响力,是时候拾起来看了。 未来简史分为三大部分,对应人类的过去、现在和未来。说实话,在读前两部分的时候,我非常失望,大部分的内容已经在前一部著作《人类简史》中,讲解的很透彻了。让我产生了一种续作圈钱的感觉。 但是读完第三部分《智人失去控制权》后,我明白了豆瓣8.5高分的原因,辛辣的观点不输前一本封神之作。同时也建议大家可以先看第三部分,再反过来看前两部分。 大量工作将被取代 人海战术的士兵,会被无人机、无人车替代,整个部队作战系统,只需要少数特种部队超级战士,加上极少数的科技专家。 月薪最高的投资顾问,也将被风起云涌的智能投顾所逐步取代。现在国际国内收益最好的基金,很多都是全凭算法的量化对冲基金。 过去机器取代一些人的工作,人总是能发明新的工作,赫拉利说这可不是自然定律。 而现在的趋势就是机器智能越来越比人更适合工作。工业革命带来了无产阶级,现在人工智能革命也会带来一个新阶层:一个对经济和军事来说都没用的阶层。 算法会比你更了解自己 民主选举这种自由主义的做法将会遭到淘汰,因为谷歌会比我自己更了解我的政治观点。 我们站在投票站里的时候,并不真正记得上次选举以来这几年的所有感受和想法。而是被最近的各种宣传、公关手法和随机想法不断轰炸,很可能扭曲我该做的选择。 正如卡尼曼的冷水实验,叙事自我到了政治领域,一样会遵循“峰终定律”,忘了绝大多数的事情,只记得几件极端的事件,并对最近的事件赋予完全不成比例的高权重。 如果授权谷歌来帮我投票,就能摆脱这样的命运了。谷歌会知道我们每次读早报时的血压,知道怎样看穿公关人员华而不实的口号。 当它投票时,依据的不是我当下瞬间的心态,也不是叙事自我的幻想,而是集合所有生化算法真正的感受和兴趣得出的结果;而这一切生化算法的集合,正是所谓的“我”。 当然,谷歌也不见得永远是对的,毕竟这一切都只是概率。但随着时间慢慢过去,数据库规模会不断扩大,统计数字会更准确,算法会继续改进,决策的质量也会提高。 只要谷歌做出足够多的正确决定,人类就会将更多权力交给它。为了“你自己的利益”,你应该让算法替你做决定。 神人的兴起 没有民主社会,大量穷人失去工作,金钱与权力大量将集中在阶层顶端。而这些人在未来或将主动利用生物技术成为“神人”。 七万年前智人的一次偶然的基因突变,获得了一个全新的认知能力:联合想象一个不存在的事物。而没有这种基因突变的人种,就再也无法理解智人的体验了。 如果真是如此,那么科技人文主义或许也只需要对人类的基因组再多做些改变,将大脑再稍微调整一下布线,也就足以启动第二次认知革命。 我们都知道第一次认知革命的心智改造,让人类能够接触主体间的领域,也就让智人成了地球的统治者; 而第二次认知革命则可能会让智神接触到目前还难以想象的新领域,让智神成为整个星系的主人。 早在一个世纪前,人类就希望创造出超人类,希特勒等人的想法是要通过选择性育种和种族清洗来创造超人。 而21世纪,我们则有希望通过基因工程、纳米技术和脑机界面,以更和平的方式达成这个目标。 神人做了认知升级,会主要着眼于对经济和政治有用的各种能力上。不相干的认知能力可能会被降级,欲望和感受可以人为控制,乃至创造,即意识与智能将产生分离。 世界上总有一些精英是一直重要而有用的。算法不能理解这些精英,这些人将成为世界的主人,站在算法系统背后,做最重要决策的人。 数据主义革命来袭 如果把每个人都想象成一个处理器,人与人之间的交流就是信息交流,整个人类社会就是一个数据处理系统。整个人类历史,就是给这个系统增加效率的历史。 如果一切都是数据处理,那我们就可以把一切问题当成算法问题。只要我们建立了一个“万物互联”的网络,这个网络和它包含的各种算法,就能够帮我们解决各种问题,替我们做出各种决定。 数据主义革命可能需要几十年,甚至一两个世纪才能成功,但人文主义革命也不是一夜之间忽然成功。 一开始,人类一直相信上帝,认为人类之所以神圣,是因为人类由神所创,有某种神圣的目的。要到许久之后,才有一些人敢说人类的神圣是靠自己,而上帝根本不存在。 同样,今天大多数的数据主义者认为,万物互联网之所以神圣,是因为它由人所创,要满足人类的需求。但到最后,万物互联网可能只要靠自己就有了神圣的意义。 总结 这个世界的变化速度比以往更快,而我们又已被海量的数据、想法、承诺和威胁淹没。 人类正在逐渐将手中的权力移交给自由市场、群众智能和外部算法,部分原因就是在于人类无法处理大量的数据。 在赫拉利的笔下,人类的未来黯然无光。少部分的智神和数据算法形成的新联盟或者说新的技术人文主义宗教,将形成无与伦比的竞争优势。 物竞天择,自然选择,它们将发动一场全新的革命,逐步统治新的世界。 在那个世界里,你和我,我们大多数人都是微不足道的存在,无价值的存在,我们对于社会经济,国家军事毫无作用。 在不可阻止的,不可逆反的信息洪流里,我们不过是数据暂时的宿主,它们终将越过我们而去。 此刻,也许是我们最后的荣光。我们该做的,也许就是珍惜此时此刻的当下。

浅谈网页搜索排序中的投票模型_河北秦皇岛魏汝要SEO自媒体

前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。先说美国选举制度,美国的总统选举是一种“赢者通吃”的方式,每个州根据其人口多少,有几十或几百的“州票”,州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的“州票”,然后统计所有候选人的“州票”多少,获得最多“州票”的候选人获胜。这样制度的问题是显然的,比如如果只有两个州,A州5个人,而B州4个人,州票也分别是5和4,如果某候选人X在A州以3:2获胜,另一个候选人Y在B州以4:0获胜,这样显然候选人Y在全国范围内获得了6张票,而候选人X只有在A州的3张票,但是由于“赢者通吃”,X获得了A周的全部5张“州票”,Y只获得了B周的4张“州票”,在全国只有1/3民众支持的X居然获得了选举的胜利。这样的情况在2000年美国总统选举中就出现过,小布什的州票领先于戈尔,然而在全国民众中统计支持戈尔的人数却是大于小布什的,当然戈尔输给小布什还有另一个原因,这里按下不表。如果放在算法领域,可以看出这里的问题在于,为了统计结果R(最适合的总统人选),找到了一个特征A(每个民众的投票),而决定结果R的,却不是特征A,而是由特征A推导出来的特征B(州票),在特征A向特征B的推导过程中,信息丢失了(每个洲的支持百分比不一样)。“赢者通吃”这种制度的具体历史原因先不说,有兴趣的朋友可以去看原著。解决这种问题的最直接方案就是从“赢者通吃”变成直选,也就是一人一票,直接统计票数,然而这样也会遇到一系列问题。在谈那一系列问题之前,先把要解决的问题抽象一下:有n个候选人,每个选民对这n个候选人投票,最终在n个候选人中选出最合适、最符合民意、也符合逻辑的那个人。方案1:一票制,每人一票,选出自己最喜欢的候选人,对结果进行统计,得票最多的那个人当选。这样做的问题是会导致作者定义的一种“鹬蚌困局”,举例说,如果有ABC三个候选人,其中BC政见比较类似,支持B的人也比较支持C,反之亦然,在全民中,喜欢BC的人占多数,A的政见和BC相反,支持A的人在全民中占少数。这样导致的后果就是,BC获得的票会比较分散,而A获得的票比较集中从而获得胜利,如果BC中有1人不参加选举,票就会集中到B或者C一个人的手中,从而使多数选民的支持者当选。前面按下不表的戈尔失败的另一个原因,就是有人认为有跟戈尔政见类似的耐德的参与,他分散了部分戈尔的选票。可以对此问题有所改善的方案叫做“二选制”。方案2:二选制,每人一票,如果无人获得大于50%的支持,则将得票最高的两个候选人拿出来,再进行一轮选举,得票多的人获胜。法国总统选举就是这样的二选制,但是这样的方法只能改善“鹬蚌困局”,而不能彻底解决,2002年的法国总统大选就出现了类似的情况,当时支持左派政见的民众较多,然而在二选制下,最终的前两名却是一个右派和一个极右派。出现这种情况的原因是当年有16个总统候选人,且多数是持左派政见者,这样就导致左派的票极端分散。方案3:n选制,每人一票,如果无人获得大于50%的支持,则去掉支持最少的候选人,再进行一轮投票,若依旧无人获得大于50%的支持,再去掉得票最少的候选人,直到有人大于50%支持为止。2001年奥委会决定北京为2008年奥运会主办城市的时候,就是用的这样的制度,在第一轮投票里大阪被淘汰,北京在第二轮就获得了半数以上的支持,从而当选。n选制的问题在于不实用,如果是奥委会这种只有几百个人投票的情况还可以使用,如果类似前面法国总统选举,有16个候选人,举国上下最多可能进行15次投票,成本太高。方案4:即刻复选制,每个民众对候选人进行排序,如果某个候选人获得了50%以上的首选,则直接获得胜利,否则淘汰票数最低的候选人,并且把票数最低候选人的得票中的第二候选人拿出来,分给对应的候选人,如果有人获得50%以上,则当选,否则再淘汰一位最低的,并且把他票分给里面排序最高的且未被淘汰的候选人,如此往复。爱尔兰总统选举和伦敦市长选举采用的是类似的方案,此方案也有问题,试想如此场景:选民共10人,中间派候选人是3人的首选,左派和右派的候选人分别是4人的首选,当然左派选民最讨厌右派候选人,而右派选民也最讨厌左派候选人,而左派右派的民众对中间派候选人倒是都可以接受,不管是即可复选制还是n选制,中间派候选人都会在第一轮被淘汰。而中间派候选人则是全体民众都可以接受的人,也最能调和各派之间矛盾,最和谐。这个方案的本质问题是,虽然每个选民可以对候选人排序,但是在第一轮的时候却只考虑了第一选,没有考虑选民的二、三选。方案5:上行复选制,跟方案4类似,只不过第一轮淘汰的不是支持最少,而是反对最多的候选人(获得最多末选票的候选人)再看上面提到的情况,中间派候选人由于不是任何人的末选,所以第一轮淘汰的是左派或者右派,再第二轮选举中,中间派的候选人就可以获胜了。方案5也有方案5的问题,考虑这样一种情况,只有两个候选人AB参选,选民9人,其中6人喜欢A而讨厌B,3人喜欢B而讨厌A,无论按照之前的哪种方式,都会是A获胜。但是现在又多了两个候选人C和D,喜欢B的3人中,都是把A列在最后一个候选的,而喜欢A的6人的末选,却是BCD各2票,这样,在第一轮选举中,A就由于获得了最多的末选票被淘汰了,而通过精心的构造例子,完全可以使B最终当选。仅仅由于CD参选或者不参选,A和B之间的胜负关系就发生了大逆转。实际使用此方案的例子不多,只有在公元前507年的雅典有类似的方案,不是让民众投支持票,而是投反对票,把反对最多的人投出局。方案6:多赛制,民众对候选人排序,然后候选人之间两两pk,统计每一张选票上看候选人A在候选人B前面还是B在A前面,如此找到获胜场次最多的候选人来赢得选举。这样的问题是可能导致循环胜负,如ABC三个候选人,有3个民众,投票分别是ABC,BCA,CAB,可以看出AB之间A获胜两次,A>B;BC之间B获胜两次,B>C,AC之间C获胜两次,C>A,这样就构成了一个A>B>C的循环。这个是不是有点像足球联赛的记分制啊,如果积分相同,足球比赛中可以再看净胜球、进球、胜负关系等,但是作者并没有在这个方面进行展开,而是介绍了另一种方式:博达制。方案7:博达制,民众对候选人排序,假如有n个候选人,第一位的候选人得n分,第二位得n-1分,以此类推,然后统计每个候选人的总分,获得最多分的获胜。有人对博达制的批评是:可能有选民会利用这种方式进行作弊(投“策略票”),最支持B的候选人本来心目中的排序是B>A>C,但是由于相对A,他们还是更喜欢B,因此,为了把B拉上来,就得把A拉下去,他们的投票就变成了B>C>A。博达对此批评的回应是:我的制度只适用于诚实的投票者。而这本书的作者却认为博达制的“策略票”问题没那么严重,如果无法准确预测民意和精确控制策略票的投法,有可能因为用力过猛,不但把A拉下来了,反而让C获得的支持票增加,这样就使得最支持B的那些人的“策略票”反而使得他们最讨厌的C当选了,当年在IMDB上就发生过类似一幕:电影《蝙蝠侠6》上映后,蝙蝠侠的粉丝们觉得这部片太酷了,于是就想把蝙蝠侠6投成IMDB第一位,于是他们疯狂的给蝙蝠侠6打高分,而同时,也纷纷的给当时的IMDB第一《教父》投低分,导致的结果就是用力过猛,教父变成了第三名,原来的第二肖申克的救赎(TSR)变成了第二(原来的第二是排在教父后面,新的第二是排在蝙蝠侠6后面),而后来,随着疯狂粉丝的热情消退,理性的意见占据了上风,蝙蝠侠6的得分逐渐下降,跌到了第10。而教父还是在肖申克的救赎后面,很久没有回去了。博达制是否有其他问题呢?以上只是对这本书第14章的一个笔记,也仅仅针对“多候选人单职位”问题进行了讨论,书的后面还会对“多候选人多职位”的情况继续探讨,也就是根据每个人对候选人的排序,来决定最终的候选人排序。回到搜索引擎领域来,如上策略的变迁会给我们一些启示,先看看之前抽象出来的问题:有n个候选人,每个选民对这n个候选人投票,最终在n个候选人中选出最合适、最符合民意、也符合逻辑的那个人。这很像搜索引擎在解决的问题:系统里有n个网页,有m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)对n个网页有不同的打分,如何根据这些特征的“投票”,选出最适合放在第一位的网页呢?从选举的例子中,我们可以得到的几个启示:1. 设计算法时,要避免出现“赢者通吃”带来的信息丢失问题。2. 不要因为某几个特征特别好,就把某个网页排到最前,或者因为某几个特征特别差,就把某个网页抛弃。3. 最合适放在首位的网页不一定是在每个特征上都最好,而应该是能够兼顾所有特征,综合表现最好的那个。4. 搜索引擎使用者对搜索结果的点击行为,可以看成是对搜索结果进行的“投票”,这样的“投票”信息的使用方式,也要注意考虑是否会带来选举过程中出现的种种不合理。以上提到的种种选举方案,仅仅是对“多候选人单职位的”的情况进行讨论,而搜索引擎面对的问题,则更类似于“多候选人排序”的情况,也即:系统里有n个网页,有m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)对n个网页有不同的打分,如何根据这些特征的“投票”,决定n个网页的顺序?而这个“多候选人排序”问题,是有一个“不可能的民主”的理论的,该理论的大意是,“合理”的民主应该满足3个条件:1. 如果选民都认为A比B好,那么最终结果应该也是A比B好2. 没有“独裁者”,也即,不存在这样一个人,无论别人怎么排序,最终结果的排序都和这个人的排序一致3. 无关因素独立性,也即,在第一次投票完成后,A排在B前面,现在进行第二次投票,如果所有人都没有改变自己投票中A和B的相对顺序,那最终结果应该也是A在B前面而通过数学的证明,可以得出结论:如果某种选举方式满足条件1和3,则必然不满足2,也即必然存在“独裁者”,这个问题的证明,可以参考这篇博客:http://roba.rushcj.com/?p=509根据“不可能的民主”理论,和搜索引擎结合起来看,似乎搜索引擎很难给出一个合理的网页排序,但是搜索引擎和投票又似乎有所不同,有两个角度可以破解1. 认为条件3过于强,需要弱化。2. 也许在网页排序问题上,真的存在这样一个“独裁特征”,这个“独裁特征”从目前看来,最适合的应该就是“用户满意度”了,按照用户的满意程度来排序网页,就是最合理的网页排序。如何衡量“用户满意度”呢?这就是我们一直在努力的。