
今天,人类在一周内创造的数据量,甚至更多的机器在一周内创造的数据量,超过了有史以来人类创造的全部数据量。再过一周,数据量又将是人类知识总量的两倍。再加上用光缆以光速传输数据的能力,可用于决策的数据范围和速度已经超出了人类的能力范围,进入了纳米空间。
在积累这些数据的同时,我们也担心这些数据的安全性。尽管我们忧心忡忡(甚至还有即将到来的纳米民主化),但大数据的优势远远大于随之而来的危险。即使是最精明的人类统计学家也会觉得如海啸般涌入的数据,在饥渴的人工智能看来不过是一滴水而已。当智能系统汲取这些数据海洋的精华时,它就会有奇妙的发现,使我们所有人受益。
系统中的数据有三个来源:人工输入、传感器读数和其他人工智能操作的结果。
数据存储在数据湖中,即本地服务器、远程服务器(包括云)、设备或闪存驱动器和光盘等可移动媒体上的数据集合。
每个数据点的访问都是为了保证质量和实用性。任何数据点都可能是错误的或不相关的。
算法是为实现既定目标而计算结果的过程。虽然每种算法都有许多步骤,但不一定需要所有这些步骤才能解决问题。由于算法是由人类编写的,因此任何步骤都可能包含无意的偏见。先知型领导者努力确保其组织使用的所有算法都能产生公平的结果。
每个结果都会依次存储在链中下一个实体(包括其他计算设备、机器人和动力机械)可以访问的位置。
有了结果,后继实体就会采取所需的行动,无论是物理运动还是进一步计算。
在每一门学科中,人工智能每天都在实现理解上的巨大飞跃,它们筛选出眼前的复杂性,并找出重复的模式。一旦某种模式与某种结果建立了常规联系,人工智能就能在每次出现已知模式时预测出这种结果。这种所谓的预测分析超出了人类的能力(因为它发生在超人类的机器领域),而且往往超出了人类的理解能力。虽然这些通信的内容是由人类创建的,但所有这些通信中包含的数据都是由机器独自收集和共享的。