新浪博客

什么是数据

2026-02-28 17:41阅读:
一、定义
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。数据是可识别的、抽象的符号。
数据不仅是数字,还是具有一定意义的文字、字母、数字符号的组合及图形、图像、视频、音频等。数据是客观事物的属性、数量、位置及其相互关系的抽象表示。例如,“012…”、“阴、雨、下降、气温”、“学生的档案记录、货物的运输情况”等都是数据。
在计算机科学中,数据被定义为:“所有能输入计算机并被程序处理的符号的总称”, 是具有一定意义的数字、字母、符号和模拟量等的总称。在整个计算机系统,甚至在整个数字世界,都是围绕数据进行工作。CPU是计算数据,内存和硬盘是存储数据,通信网络是传递数据。数据本身是没有意义的,是未经加工的“原材料”,经过处理和分析之后,数据才能转化为有意义的信息。
二、数据与信息的关系
数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等;信息是数据的内涵,信息是加载于数据之上,对数据作具有含义的解释;数据和信息是不可分离的,信息依赖数据来表达,数据则生动具体表达出信息;数据是符号,是物理性的,信息是对数据进行加工处理之后所得到的并对决策产生影响的数据,是逻辑性和观念性的;数据是信息的表现形式,信息是数据有意义的表示。数据赋体产生信息,信息赋能产生智慧。
三、数据的特性

符号性:数据以符号形式存在,例如数字,以及刚才提到的文字、图像、音频、视频等。
客观性:数据反映了现实世界事物的属性、状态、关系等情况。它是客观存在的,不随主观意志而改变。
量化性:数据通常以量化的形式存在,便于计数、测量和统计分析。
可比性:数据之间可以进行对比分析,通过比较可以揭示数据之间的关系和差异。
可传递性:数据可以通过各种方式进行传输,如电子文档、纸质报告等,使得信息能够在不同个体或组织间传递。
可存储性:数据可以被存储在数据库、文件系统或其他存储介质中,以便于未来的访问和使用。
可处理性:数据可以通过计算、分析、加工等手段进行处理,以提取有用信息或转化为知识。
多维度:数据可以从多个角度进行观察和分析,如时间、空间、类别等多个维度。
多样性:数据有多种多样的类别和形式,能够满足不同领域和需求。
时效性:数据可能随时间的推移而发生变化,某些数据在特定时间点之后可能失去价值或准确性。
可靠性:数据应该是可靠的,即数据的来源、收集方法和处理过程应该是可信的,以保证数据的准确性。
相关性:数据之间存在相关性,某些数据的变化可能会影响其他数据的表现。
可解释性:数据应该能够被解释和理解,其背后的意义和代表的现实世界情况应该清晰。
限制性:数据可能受到隐私、法律、伦理等因素的限制,使用数据时需要遵守相关规范。
四、数据分类
定位数据:比如各种坐标数据;
定性数据:指表示事物属性的数据(居民地、河流、道路等);
定量数据:反映事物数量特征数据,如长度、面积、体积、重量、速度等物理量;
定时数据:反映事物时间特性数据,如年、月、日、时、分、秒。
数字数据:如各种统计或量测数据,在某个区间内是离散的值;
模拟数据:由连续函数组成,是指在某个区间连续变化的物理量,又可以分为图形数据(如点、线、面)、符号数据、文字数据和图像数据等,如声音的大小和温度的变化等。
按记录方式分为:地图、表格、影像、磁带、纸带。
按数字化方式分为矢量数据、格网数据等。
地理信息系统中,数据的选择、类型、数量、采集方法、详细程度、可信度等,取决于系统应用目标、功能、结构和数据处理、管理与分析的要求。
五、大数据
大数据是指通过对数据的获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。它不是单一的技术,而是一套从数据进来,到最后出结果的完整技术体系。大数据就是在浩如烟海的信息中,利用数据分析技术,对冗杂无序的数据进行整理和分析,再迅速筛选出有价值的信息。大数据就是通过发现其中的数据特征,激活数据价值,从而做出提升效率的决策行为。
中国前瞻产业研究院20208月发布的《2020年中国数字经济发展报告》显示,自2015年提出“国家大数据战略”以来,我国的数字经济市场规模迅速扩大,截至2019年末,数字经济的总体规模达到了35.8亿元,占GDP36.2%2021年上海数据交易所成立,其面向全球开展大数据综合交易,这“可能是第4次工业革命的变革性事件之一”。
20254月,国家发改委已经将隐私计算等新技术应用于信用信息的共享应用,降低信息泄露风险。同时,将探索运用区块链技术,推动关键数据“上链”,实现数据加密处理和流程可塑

我的更多文章

下载客户端阅读体验更佳

APP专享