什么是结构化数据?

结构化数据:行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。

非结构化数据:不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。

如何选择不是基于数据结构,而是基于使用它们的应用程序:关系数据库用于结构化数据,大多数其他类型的应用程序用于非结构化数据。

就像“结构”一词本身的意思一样,数据有高度组织化且格式整齐的特点。可以放入表格和电子表格中的数据。这种数据也称为定量数据。大多数企业将交易数据收集为结构化数据,其中包括符合合规性标准的财务信息。

结构化数据中最好的案例就是消费者数据。

还有我们常见的信用卡号,财务金额,日期,电话号码,地址和产品名称。

顾名思义,非结构化数据没有被组织或正确格式化的。在数据的收集,处理和分析上都是一项巨大的跳转。非结构化数据也称为定性数据,涵盖了结构化数据所没有的所有内容。非结构化数据每年都在增长,长期来说会出现难以管理的问题。

常见的非结构化数据包括报告,音频,文件,文本文件,社交媒体评论,意见,电子邮件等等。

其中由人工生成的典型非结构化数据包括:

  • 文本文件:文字处理,电子表格,演示文稿,电子邮件,日志等。
  • 电子邮件:由于其,电子邮件具有一些内部结构,有时我们将其称为半结构化。但是,其消息字段是非结构化的,并且传统的分析工具无法对其进行解析。
  • 移动数据:短信,位置。
  • 通讯:聊天,即时消息,电话录音,协作软件。
  • 媒体:MP3,数码照片,音频和视频文件。
  • 业务应用程序:MS Office文档,生产力应用程序等。

典型的机器生成的非结构化数据包括:

  • 卫星图像:天气数据,地形,军事行动。
  • 科学数据:油气勘探,空间勘探,地震影像,大气数据。
  • 数字监视:监视照片和视频。
  • 传感器数据: 交通,天气,海洋学传感器。

结构化数据与非结构化数据之间的区别

通过以上的举例,对于结构化数据和非结构化数据之间的区别应该有一些了解了。

结构化数据易于收集,分析和存储,而非结构化数据则是无组织的,需要通过更多的方式进行调查处理。非结构化数据还涵盖了更多的领域,随着internet的不断扩展,非结构化数据的例子也变的越来越多。

在某种意义上,非结构化数据与我们人类处理和分析信息的方式类似。如果你和某人交谈,所有的信息都是以一种无组织的方式传递的。尽管如此,我们仍然能够消化并理解这些数据。另一方面,结构化数据更符合计算机处理数据的方式。它组织整齐,易于分析。

免责声明:凡未注明来源或者来源为网络的信息均转自其它平台,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。网站只负责对文章进行整理、排版、编辑,不承担任何法律责任。若有侵权或异议请联系我们删除,谢谢。

}

我要回帖

更多关于 结构化数据包括哪些内容 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信