数据库与数据仓库有什么区别?
来源:海牛大数据 时间:2020-11-26 16:13:14 编辑:简单
在大数据的学习当中,我们常常会听到数据库、数据仓库。看起来一字之差的两个专业词汇,常常引起很多的误会,尤其是刚开始学习的新手,对于这两个概念常常认识不清。今天我们就来讲讲数据库与数据仓库有什么区别?
首先,从比较浅显的层面来说,数据库有很多选择,在企业当中,数据库是实现数据管理的工具,企业当中,不同来源的数据,可能存在不同的数据库当中,比如说MySQL、MangoDB、Oracle等。
而数据仓库,则是针对于这些不同来源的数据进行整合,它可以对多种业务数据进行筛选和整合,用于支持下一步的分析处理。
理解了数据库与数据仓库各自要做的事,接下来我们来谈谈这两者的区别。
概念上的区别
数据库是一种逻辑概念,而数据仓库是数据库概念的升级。
从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方。只不过从数据量来说,数据仓库要比数据库更庞大的多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。
数据存储与应用
数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用。
数据库存放的是当前值,数据是动态变化的,且访问量少但访问频率高;而数据仓库存放静态的历史数据,只能定期添加、刷新,访问频率低但访问量却很高。
此外,数据库中的数据结构比较复杂,有各种结构以适合业务处理系统的需要,面向业务处理人员的,为业务处理人员提供信息处理的支持;而数据仓库中的数据结构则相对简单,面向高层管理人员,为其提供决策支持。
技术上的区别
数据库与数据仓库的区别,实际讲的是OLTP与OLAP的区别。
OLTP:操作型处理,也称联机事务处理,表示事务多,但执行大多较短,并发量大的数据库,如日常的进销存操作等;系统强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强调并发操作。
OLAP:分析型处理,也称联机分析处理,表示事务较少,但执行大多较长,并发量较小的数据库,如基于数据仓库的操作;系统强调数据分析,强调SQL执行市场,强调磁盘I/O,强调分区等。
模型上的区别
数据库:主要遵从范式模型(1NF,2NF,3NF,等等),从而尽可能减少数据冗余,保证数据引用的完整性。
数据仓库:强调数据分析的效率,复杂查询的速度,数据之间的相关性分析。数据仓库多使用多维模型,提高数据分析的效率。
数据库与数据仓库有什么区别?以上就为大家做了简单的介绍了。大数据学习,对于数据库和数据仓库的理解,需要区分开来,尤其是做开发,一定要理解到位才行。
海牛大数据专注于大数据课程开发及培训,"因为专注,所以专业"。如果您想要了解更多大数据的知识,您可以浏览我们的网站,我们会为您提供更专业服务。