大数据原理
时间:2022-02-20 22:30:01 | 来源:信息时代
时间:2022-02-20 22:30:01 来源:信息时代
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的'加工能力',通过'加工'实现数据的'增值'。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。
随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。《着云台》的分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
最小的基本单位是Byte,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB,它们按照进率1024(2的十次方)来计算:
1Byte=8bit
1KB=1,024Bytes
1MB=1,024KB=1,048,576Bytes
1GB=1,024MB=1,048,576KB
1TB=1,024GB=1,048,576MB
1PB=1,024TB=1,048,576GB
1EB=1,024PB=1,048,576TB
1ZB=1,024EB=1,048,576PB
1YB=1,024ZB=1,048,576EB
1BB=1,024YB=1,048,576ZB
1NB=1,024BB=1,048,576YB
1DB=1,024NB=1,048,576BB