2018 年终总结:数据科学驱动数字经济与互联网新发展

日期: 2024-06-27 08:05:24|浏览: 405|编号: 55087

友情提醒:信息内容由网友发布,本站并不对内容真实性负责,请自鉴内容真实性。

注:本文是2018年10月信息社会50人论坛的年终总结,特此整理与大家分享。

摘要:数据科学让我们从数据中观察到人类社会越来越复杂的行为模式,基于数据的技术决定着我们的未来。无论是大数据、人工智能还是区块链技术,都在推动数据科学产生新的洞察,驱动数字经济和互联网行业向新的方向发展。区块链技术在一定程度上是一种制度创新。制度创新很少发生,但一旦发生,就是颠覆性的。要理解区块链技术、价值和应用前景,我们需要更好地理解区块链的技术原理。

我们从云计算开始积累了大量的数据,随着业务自动化导致海量数据的存储,大数据就出现了。大数据之后,计算能力提升了,我们发现了人工智能时代的到来。然后物联网带来了边缘计算,今天,又出现了一个概念叫区块链。2016年整个数字经济、互联网行业的社会关键词是大数据,2017年是人工智能,2018年人们说是区块链。

基于大数据的深度学习和人工智能取得了非常重大的技术突破,这种突破一方面解决了视频、图像、文字、声音、语言的计算机处理问题,另一方面在产业应用和国家竞争力方面并没有得到加强。我们也看到,在大数据领域一直有这样一句话,叫软件定义一切,数据驱动未来,算法统治世界,特别是算法在今天,个性化推荐能够越来越让我们感知和营销到每一个消费者个体,数据科学会产生洞察,数据科学让我们能够从数据中观察到人类社会越来越复杂的行为模式。基于数据的技术决定了我们的未来,但不是数据本身,而是我们从数据中掌握的可用知识的增加。而这种知识的增加是因为机器学习可以产生预测。另一个非常重要的深度学习技术已经产生,它使得人工智能能够产生行动。这些新的数据驱动技术正在不断改变我们的经济、社会和研究技术。

今天大家可能比较关注的是技术的变革,其实我们会发现当中国在世界处于一个比较大的经济规模的时候,我们的社会变革也面临着技术的颠覆,而这个颠覆可能就是我们今天要重点讲的区块链技术。

说到区块链技术,必然要提到数字货币,或者说钱。钱是什么?钱有三个功能:第一,钱是交换媒介,没有钱的话,我们要拿牛去换羊;第二,钱是储蓄媒介,存一只羊或者一篮子鸡蛋,羊会死,鸡蛋烂了就没有价值了,所以我们就存钱。第三,钱是计量单位,我们可以把计量分解开来进行所谓的价值交换。区块链技术产生了数字货币,一种基于互联网数字经济的新型价值交换货币。数字货币主要作为货币媒介、交换媒介、储蓄单位、价值尺度,因此具备了货币的特性。

它是怎么产生的?我们今天讲的区块链到底是什么?其实它建立在互联网上,我们知道互联网是信息交换的,区块链叫价值交换。什么是价值交换?我们知道在现实社会实体经济中,就是一种价值交换。如果我给你100块钱,我就不再有100块钱了。但是在互联网上,我给你一个文件,给你一张照片,我还是有的,我只是复制给你而已。而我复制给你了,我又可以把这个照片,这个文件复制给别人,这样就形成了一种双重支付,多重支付的形式。如何避免这种多重支付,双花的问题?如何实现任意两个人之间的P2P交易?当然,这需要在特定的社区中形成共识机制。

我们讲区块链,有人说区块链是严肃的技术,比特币严肃不严肃我们也不知道。但是不能脱离货币来谈,因为社会变革最重要的是价值交换,价值需要衡量。今天没有货币,你就进不了这个交易门槛。换句话说,你不懂股票就进不了证券市场,就像今天有货币才能进这个交易环境一样。

最开始是一个叫中本聪的人在2008年发表了一篇学术论文,2009年1月3日产生了第一枚比特币,第一个区块链就此诞生。时至今日,比特币的价值已经成为区块链技术的核心,成为数字货币的形态。中本聪主要描述了P2P交易技术的实现,如何利用区块链技术实现两个人之间基于现金的交易,电子交易系统或者数字现金交易。从2008年到现在,10年的时间,人们才真正认识区块链,发现比特币的底层技术就是区块链技术。

什么是区块链?区块链为什么会改变世界?大多数人听到的概念叫矿工或者挖矿。其实今天获得一个叫比特币的东西主要有三种模式:第一种就是当矿工。挖矿现在很难或者不可能,或者普通人挖不到,因为它的机制决定了它可以并行计算。所以现在到2140年,挖矿总量就完成了,2100万个比特币的总量就被封顶了。现在已经挖出了1700多万个币,也就是说总量是固定的,所有发行的币一般都有一个固定的币总量。什么意思呢?就是说这种币本身存在或者天生就具有通货紧缩的特性,而不是通货膨胀的特性。另外两种模式就是交易收藏比特币或者进入类似证券期货的比特币交易市场进行买卖。

人们很早就发现了比特币的价值,早些年有人用 10000 枚比特币买了一个披萨,但今天,1 枚比特币的最高价格已经达到或接近 20000 美元,2016 年左右,比特币一度达到 9000 人民币,2017 年 12 月几乎达到顶峰,今天,1 枚比特币的交易价格约为 7400 美元。

我们知道传统的纸币是跟黄金挂钩的,脱离了黄金这个概念,纸币就只是废纸,它之所以成为货币,是因为有国家、有银行做后盾。那么我们想知道比特币是怎么产生的呢?其实它是基于区块链技术产生的。这里有一个数学函数,准确的说是哈希函数,我们只要输入一个X,就会得到一个字符串,也叫哈希。这个哈希可能是64位的,所以通过哈希算法就可以得到标准的加密算法,HSA就是256位的哈希安全算法,基于这个算法,我们就会生成一个字符串,这个概念很重要。

如果我们想知道某人是否知道一个答案,但是他不愿意告诉我,我也不愿意告诉他,那我怎么知道他知道答案呢?那只要有人把他所知道的答案作为X输入到一个哈希函数中,我们就得到了我们所谓的哈希值,而我的答案也通过它生成一个哈希值。如果我们的哈希值相同的话,我就认为他知道答案了。这就产生了一个很重要的特性,就是任何东西,无论是一张图片,一个数据包,还是一张电子证件,只要输入X,当输入X的时候,就会得到一个唯一的哈希值。任何一点小小的改变,比如输入一张图片,只要人眼睛里的某个像素点发生一点点变化,哈希值就会产生巨大的变化。

这时候我们会问矿工在这里干什么?矿工就是POW(Proof of Work),也就是所谓的工作量证明。原来我跟另外一个P2P交易的时候,会发现这个交易其实就是记账。我借给A100块钱,A借给B100块钱,B借给C100块钱,其实C欠我100块钱。而且只要在这个过程中记账,我们就没有现金交换,也不需要现金交易。所以A给B,B给C,C给D,D给A,它本身的记账过程就是一个账本。我不需要真的拿钱或者黄金去背书这件事情,只要大家都认可就可以了。这时候我们要记账,谁来帮我们记账呢?想象一下区块链是什么,我们有一本账本,里面有页,第一页叫做创世区块,每一页就是一个区块。 这一页记录了谁给了谁多少钱,所以你有多少钱,从区块账本一开始就记录在你的交易行为里。比如我今天有15块钱,我想给B 10块钱,我的交易其实记录的是,我给了B 10块钱,给了自己5块钱。这个交易就从15块钱的记账区块转移到了另外一个记账区块。

矿工的作用是什么?就是帮你确认这个账目是不是正确的。那么,矿工怎么确认这个账目呢?就得挖矿。挖矿的过程其实就是找到一个哈希值。这个哈希值有一个特殊之处,因为64个哈希值有很多种可能性。规则规定,只有哈希值的前几位为零,才能把区块写入区块链。只要你能猜出前4位或者5位数字,这就叫难度。如果是4位或者5位数字,比如说4位数字,这4位数字保证了这个就是我能写的区块。在这个过程中,谁先找到可以写入区块的哈希值,谁就能获得奖励。这个奖励一开始是50个比特币,每4年衰减到25个,今天大概是12.5个,也就是说挖矿越来越难,因为挖矿需要大量的算力和电力。 随着比特币交易量的增加,参与挖矿的矿工(矿机)数量暴涨,难度越来越高。比特币挖出来之后,未来比特币交易只能通过交易费作为挖矿奖励。据说现在在中国挖一枚币,不考虑除了用电量之外的其他因素,成本大概在1500美元左右,而最便宜的可能在委内瑞拉,大概600美元左右。中国是矿机和挖矿生产大国。

一个区块是由5部分组成,第一部分是前一个区块的哈希值和时间戳,另一部分就是我们看到的哈希值,这个区块的哈希值。另外DATA就是我们以后要做的数据工作。现在在比特币的概念里,这个DATA里面就包含着我们的交易账本,类似于一本一页一页的账本。Nonce是什么意思呢?其实就是矿工需要猜出一个满足特定区块哈希值的随机数。因为生成满足前4个零的哈希的过程很慢,而且可能性很多,所以必须把DATA值放进区块里,然后不断改变Nonce,就像猜1、2、3……一样去计算。计算的过程就看谁的算力最强,谁先算出来谁就赢了。这个过程就形成了区块链的基本模型。

我们可以看到区块链的大致运行原理。如果我在区块链中只写了一句话,这个叫创世块。现在生成一个新的区块,你想写什么都可以写,比如你写了沈浩,沈浩这两个字就会生成一个新的区块,这个区块是永久记录下来的。这个新的区块有它的时间戳,而且这个区块计算一定次数之后,你就可以再写一个,比如你稍微改一下,它就变成了另外一个区块,这个区块就会不断生成链。现在你想把这个链的区块改成2,你就会犯错误。为什么呢?如果这里是1,你在这里改一下,比如这里改成2,你会发现后面的整条链都是错的,所以你想篡改这个账本就变得不可能了。

账本就是一本记录第一、第二、第三、第四个区块的书,但是这个书也是有容量的,目前基于比特币区块链,这个DATA内容只能容纳一兆字节的内容。要保证10分钟挖出一个区块,就必须调整难度,保证10分钟记录一个区块。但是需要10分钟才能完成的记账确认,让交易变得非常慢。我们知道微信支付刷卡的时候,卖家看到了,到账了,如果10分钟才能到账,你愿意吗?所以,为了解决比特币的应用问题,大家会有分歧。

有人说可以增加数据容量,这样内容可以更多,交易写入速度更快,但这可能会改变一些人对比特币的信念。但也有人说应该是8兆,这会导致比特币分叉,比如Bit Money,也就是另一种新的比特币账本。从逻辑上讲,这就叫分叉。

什么是分叉?就好比在笔记本里写到第50页,写到第51页后,又拿一本新的笔记本重新写第51页,有的人还从第0页开始写,这些都是有可能的。所以比特币和区块是不断记录的,不可篡改。如果要篡改,就得达成一致,也就是51%的人同时达成共识才能篡改,但是这个在数学上是可行的,但是在实际中由于成本和时间原因根本就不可能做到。这时候链一旦写好了,就不可能再改了。整个交易过程其实用的是数字签名,其实就是一个数字代币。

特别是在区块链行业,人们把比特币称为数字加密货币,但是还有很多其他的货币,就像美元、人民币、各种里拉,在区块链上一般都叫代币,这些代币就是数字代币,所以就叫代币,现在人们叫它代币经济。其实所有的交易都是通过这个数字签名来完成的。有人开发了莱特币,比特币大概每秒可以处理7笔交易,每10分钟记录一次,莱特币每2.5秒处理一笔交易,这时候就有人发明了莱特币。但是这一切只是为了记录账本。中本聪发明的目的就是为了解决数字货币这种现金交易的账本,所以它只是用来记账的,跟其他的东西没有任何关系。它只是用来记账的,只是用来做现金交易的。但是人们发现了什么?如果这个账本可以做到这一点,为什么不让区块链做点别的事情呢?

于是有人开始用区块链搭建一个以太坊,在上面开发应用叫Dapp,作为一个操作系统。理论上任何人都可以在以太坊上开发各种应用。开发出来的软件叫,就是开发智能合约很简单的一个类似程序。以太坊是一个操作系统,相当于有了一个可以开发各种智能合约或者交易协议的操作系统。

但是有开发者想解决另外一个问题,如果以太坊上谁都可以开发,运行它也是需要费用的,所以需要有ether,gas,以太币等等。后来有人开发了一条区块链叫EOS,限制不是所有人都可以在上面开发,只有被认可的DAPP才能在上面开发应用,但是最大的价值或者说区别是什么呢?就是以太坊还是需要通过挖矿和耗电来解决问题。然后EOS直接从工作量证明转到权益证明,POW就是工作量证明,POS就是权益证明,权益证明意味着不要再挖矿了,因为挖矿是要耗电的。以后谁有钱谁出钱多,谁出钱承担责任通过投票获得权益记账和奖励。EOS原则上允许每年一定量的通胀。

交易还是通过数字签名来进行的,数字签名是通过私钥加公钥来进行的,公钥是由私钥生成的,就像哈希算法一样,你手里拿着一把私钥,把私钥放进哈希函数中生成公钥,公钥就可以拿给别人看了,同时通过哈希函数生成一个地址。但是人们会发现,除了钱的交易,数字现金的交易,区块链有没有可能不是用来做现金交易的,而是用来做应用的?2016年左右,出现了一个新的区块链,被大家认可的就是以太坊,这时候才发现,区块链的核心概念或者说应用前景,就是以太坊区块链这个概念的应用。

这里给大家一张图,如果大家能看懂这张图的话,我们就知道,有一个开源的安卓操作系统。其实在手机APP领域,主要有两个操作系统,一个是安卓,一个是iOS。基于开源的安卓,我们会开发各种APP,包括微博、微信、今日头条、大众点评、摩拜单车和滴滴出行等等,这些应用其实都是基于安卓或者iOS的,底层其实是我们基于互联网或者移动互联网的网络技术,或者一些IP协议。但是今天中本聪发明了比特币,比特币的底层直接就是区块链。但是所有想做同一种数字货币的人,是不是都要从同一个底层去开发呢?人们会发现,在区块链技术之上,有一个23岁的俄裔加拿大人()。他编了一套类似于开发Dapps的操作系统(虚拟机),叫以太坊。

以太坊也是一个区块链,它希望大家在这个链上不断的构建各种APP应用,这种APP应用就叫Dapp,分布式的Dapp,首先就是去中心化,去中心化是什么概念呢?

我们可以看到左边叫中心化,中间那个往往叫幂律分布,其实就是去中心化,右边那个叫分布。中心化的概念不只是去中心化,还有就是去信任化。为什么呢?数字经济往往是服务经济,价值交换。服务就是价值交换,你得不到产品,你只得到功能和价值。我们的电商平台、互联网经济大部分都是典型的服务业。

基于服务经济,对于普通人来说,不同的人对区块链技术有不同的看法。计算机IT人员认为区块链是一个分布式的加密数据库。金融人员认为它是一个账本,是一种记账的方式。技术变革者认为区块链是下一代的互联网,甚至有人称它为全球互联网或者全球计算机。这里面的一切都是去中心化的。具体来说,去中心化的概念就是去国家、去政府、去企业。区块链的应用前景是让交易离开中心化的管理,让人们在交易中相互信任。所以这种去中心化完全是通过数学、密码学、计算机科学的代码和算法产生的。所以有一句话叫代码就是法律。这个法律主要基于以太坊上的智能合约,而这个智能合约是通过建立社区形成共识机制来实现的。

共识机制是什么?其中一个重要的概念就是零知识共识(零知识证明),就是说我们彼此之间没有必要的知识,就可以达成共识。当然这个共识是指多数人达成的共识。这里面就会出现各种各样的应用和新的名词。这些名词和新的应用,比如分布式应用,分布式账本,智能合约等等。银行在这个过程中起到什么作用?银行已经不需要了。为什么?我跟人有交易的时候,美元和人民币要兑换,汇率是会损失的。我们兑换的时候可能会跨国界,会受到外汇管制。钱不够的时候,还需要第三方或者我的客户银行帮我确认我有没有钱。这些东西都是分布式记账。所谓的分布式记账,就是一个账本,如果区块链社区有50个人,都在圈内,就意味着我们每个人都有自己的一套账本。 如果我更改了我的分类账,我也需要更改其他人的分类账,这几乎是不可能的。

代码即法律,它是如何形成今天的新型数字经济的?首先它有很多优点,比如透明性。今天世界上所有基于以太坊或者区块链的交易都是可追溯的,任何人都可以查看这笔交易,但是无法查出这个账户背后是谁。人们只知道两个账户进行了交易,所以这笔交易是加密的。这种加密交易导致市场上出现了大量的比特币或者代币。早些年人们经常用这笔交易来洗钱、贩毒,还有我们所说的非法军火交易,包括现在的赎金。我们知道有大量的敲诈勒索者在取钱的时候最终被警方抓获,这只是他们最先发现了比特币或者这种数字交易方式的特点,但是比特币本身是比较安全的,没有人能够改变这种交易行为。

基于以太坊的应用需要编写智能合约,智能合约其实就是在以太坊上实现P2P交易的计算机代码。代码写好之后,只要你点击一下,就代表你确认了这笔交易。确认就是认可,动作就是确认,不可逆转。

基于区块链的应用,或者基于以太坊的DApp开发,如何才能真正形成区块链经济体系?比如说,有人是一个词曲作者,他写了一首歌,这首歌是给其他听众听的。那么如何保证听众点击听的时候,创作者得到收益呢?当然,当很多听众点击听的时候,创作者会不会把钱给作词人、作曲家、吉他手等合作者呢?当以太坊区块链下所有的协议都以智能合约的形式写出来,只要音乐生态里有任何点击,智能合约就会自然执行,价值交换就会自动发生。

我们知道服务经济中的交易方总是不信任对方的,因为乙方完成一个服务任务,甲方不会给他钱。当然有时候甲方也不信任乙方。你的毕业证是真的吗?交易信用证靠谱吗?你真的有驾照吗?你真的是这样的人吗?你的月收入真的达标吗?数字经济中的交易方如何建立信任体系?信任可以在去中心化的无信任环境下得到部分解决,因为如果我向你要证据,哪怕是你的私密照片,你只需要给我写好并经过区块链认证的证据,我不需要看到内容就能证明。要证明你的爸爸是你爸爸,循环证明可以借助区块链的无信任性得到解决。

我们每天在社交网络上写自己的经历,但是如果网站市值到1000亿,就跟我们没关系了,我写了那么多都是白写了。但是如果是区块链下的社交媒体,我每写一篇文章,你看了就会产生价值的交换,因为有一种货币,这些货币大部分都是代币。当然你发ICO,这个就叫发代币,我们国家是严格管控,禁止这个的。所以老挝、新加坡、日本都做了一些代币的发行。但是从另一个角度看,其实在社交媒体环境下,我们所有的行为都是一种价值的交换。

今天我们假设一个市场有50个参与者,每个参与者都有数据或者部分数据,大家都希望数据的买卖或者交换能够产生更大的商业价值,实现数据的价值交换。但是一旦一个文件,比如一个公司的数据包,被给了另外一个公司,那么这个公司就需要知道这个数据包有没有被卖给别人了,如果分发没有问题,就不能卖给别人,那么我们的数据共享就可以通过智能协议下的区块链来解决。

目前区块链应用领域不应该把重心放在炒比特币或者炒代币上,但是没有币就玩不了区块链,就进不了这个技术领域。数字货币只是区块链应用的价值交换或者价值媒介的外在形式,我们更应该关注区块链技术。区块链是我们在所谓的去中心化、无信用的体系下可能产生的应用或者价值,为我们实现未来的数字经济。我们知道金融行业包括任何其他行业都在开始思考区块链对行业带来的影响或者改变。当然这种改变有好的一面也有坏的一面,因为有人把它当成太空币来玩,也有人把它变成赚钱的工具,他们不是想着怎么开发智能协议,而是想着怎么炒作比特币、炒作代币。这不是我们想讲的,也不是本文的目的。

但是从另外一个角度来说,除了我们现在讲的区块链、比特币这些概念之外,主要是指公有链,就是任何人只要有电脑、有网络,都可以参与操作的一种方式。它不歧视任何人,当然它歧视那些不懂电脑、不懂这些操作的人,谁想做都可以做。今天发展起来的第二个应用不是公有链,而是联盟链,10家银行、100家银行之间怎么建立信用体系,发行信用凭证等等。可能有些行业可能会先产生一种叫智能合约的联盟链,区块链,来建立多家公司的联盟。当然也有私链,相当于通过区块链,在一个公司内部或者一个特定的社区里,建立成员之间的信任关系或者交换行为,这个可能只是一种叫私链的方式。

现在的区块链行业主要分为两个部分,一部分叫币圈,就是炒币、发币、众筹、用币创业的人。一部分人做区块链圈,主要开发各种应用协议和行业应用。因为基于公链的区块链创业公司是开放的。未来区块链的应用会非常多。有一句话叫,一切可以编程的东西,都会利用区块链的智能协议重新编程。所有电子交易行为的特性都可以单独上链,因为上链的过程是免费的,不需要买服务器,社区里所有人都会参与。不需要云计算,大家都在用云计算,大家的节点都在参与,但至少是三个人在玩。

目前,比特币在全球范围内受到监管,而整个区块链技术也是如此,我们突然学习使用互联网技术,当然是​​在互联网上发送和接收互联网。当互联网刚开始时,没有人认为互联网可以用于今天的电子商务,没有人认为互联网会成为生成大数据并改变社会经济结构的重要资源。

由于比特币基于稀缺的商品提供了独特的经济结构,因此可以通过一种精确模拟比特币通货膨胀的算法来促进比特币的采用和工作证明。

对我们来说,当大数据才能被培养时,我们的人工智能的需求是否会到来,但无论是什么,我们都需要有两个人的知识,但我们只有两个人都在谈论这两个典型,但我们是否会有两种典型的构造,但我们是否会有两种技能,这是数学上的,但ENCE和区块链。

在一定程度上,区块链技术是一种机构创新,很少发生,但是一旦发生,这种破坏性的创新通常会受到传统经济体系的限制和阻碍。

提醒:请联系我时一定说明是从101箱包皮具网上看到的!