打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Excel应用大全 | 来认识Excel数据源吧!
一本书教会你分分钟搞定数据分析!



跟着小编一起来来认识一下Excel丰富多样的数据源吧!


统一的数据获取和转换体验

从 Excel 2016 开始,Excel 引入了一组强大的数据获取和转换工具 Power Query,使用户可以轻松地连接、 合并和组织来自多种来源的数据。在 Excel 2019 中,【数据】选项卡上数据导入和转换相关功能进行了布局调整,如图 2-1 所示,统一的使用体验得到了进一步加强。无论是各种离线文件,还是企业级数据库,甚至 Azure 和联机服务等,Excel 的数据获取和转换功能都可以轻松处理。

2-1 Excel 2019  上和2016  下【数据】选项卡对比




文本数据


文本数据是指以纯文本形式存储的表格数据,主要包括数字和文本,日期则可视作数字和文本的组合。文本数据文件是一个字符序列,使用任意文本编辑器都可以查看和编辑其内容。文本数据文件具备良好的跨平台适应性,在 Windows 中制作的文本数据文件,可以在Mac 和 Linux 系统中直接使用,反之亦然。除此之外,绝大多数编程语言都可以轻松地解析文本数据文件。因此,文本数据经常作为不同系统之间导入和导出、用户或网站之间交换数据的文件格式。

使用文本数据时一定要注意文件的编码格式,常用的编码格式有 UTF-8 和 GB2312 等。借助文本编辑器(如免费编辑器软件 Notepad++)可以查看文件的编码格式。如图 2-2 所示,文件内容看似相同,但是文件格式却不完全相同,这两个文件分别使用了 UTF-8 BOM和 GB2312 格式。如果使用不正确的格式打开或导入文本文件,可能导致显示乱码。


2-2 不同编码格式的文本数据文件

常用的文本文件格式有 CSV、XML 和 JSON 等。

1. CSV 数据

CSV(字符分隔值,其全称为 Comma-Separated Values)是一种被广泛使用的通用文件格式。虽然被统称为 CSV 文件,但是其文件扩展名并不限于 CSV,也可以是 TXT、TSV和 PRN 等,甚至可以是其他扩展名。通常 CSV 文件具备如下几个特点。

(1)数据记录按照行的形式保存在文件中。

(2)数据记录之间使用某种换行符(不同平台或软件中有差异)分隔。

(3)每个记录行都具备相同数量的字段序列,并且排列顺序相同。

(4)在一个记录行中,字段之间使用指定分隔符进行分隔,典型分隔符有制表符、分号、逗号和空格等,当然也可以使用其他字符作为字段分隔符。

严格来说 CSV 不是一种数据格式,因为并不存在 CSV 文件格式通用标准,只是在RFC 4180中对其进行了基础性的描述,系统之间完全可以定义私有的专用 CSV 格式标准用于数据交换。在这样宽松的约束条件下,可想而知会产生很多 CSV 变体,也就无法保证 CSV 文件完全互通,但是这并不妨碍 CSV 文件成为简单数据交换业务场景中的常用文件格式。

2. XML 数据
XML(可扩展标记语言,其全称为 Extensible Markup Language)是一种标记语言。XML 是由 SGML(标准通用置标语言,其全称为 The Standard Generalized Markup Language)发展而来的,1998 年 2 月 W3C(万维网联盟)发布 XML 1.0 规范,自此之后XML 被广泛地应用于跨平台数据交换。XML 文件的结构与 HTML 文件很相似,但是二者的用途是有明显区别的,HTML 用来展示各种数据,而 XML 是用来传送和交换数据的,并不用来展示数据。
XML 文档中字符可以分为两类:标记和内容。标记通常以“<”作为起始标记,并以“>”作为结尾标记,不属于标记的字符就是内容。
3. JSON 数据
JSON(JavaScript 对象表示法,其全称为 JavaScript Object Notation)使用完全独立于任何编程语言的文本格式来表示数据,这是一种轻量级的数据交换格式。JSON 是ECMAScript 规范(欧洲计算机协会制定的 JavaScript 规范)的一个子集,详细的 JSON 标准规范请参考在线文档(http://json.com/specs/)。
由于 JSON 天生具备了简洁和清晰的层次结构,易于计算机进行生成和解析,从 2005年开始,JSON 成为主流的网络数据传输和交互格式。进行网页数据抓取时,很多页面请求的返回结果都是 JSON 格式的数据。
既然 JSON 脱胎于 JavaScript,那么可想而知,想要应用 JSON 数据一定要了解一些JavaScript 的基础知识。在 JavaScript 编程中,一切都是对象,这是 JavaScript 语言的特点之一。JavaScript 所支持的数据类型(数字、数组、字符串等)都可以使用 JSON 格式来表示。但是这并不意味着 JSON 只能应用于 JavaScript,事实上绝大多数编程语言都可以很方便地使用 JSON。

还想要学习其他数据处理与分析的知识吗?快来看看应用大全吧!

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
如何利用 Python 读取数据科学中常见几种文件?
手把手教你如何用Python从PDF文件中导出数据
R语言笔记丨数据储存文件的类型与介绍
批量汇总文本、JSON、PDF、WORD文件数据……,都给您整理好了!
R语言如何导入数据
跨平台数据分析自动化流程
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服