使用JS解析excel文件的完整实现步骤

js excel解析 js处理excel文件 Excel文件解析 2022-11-13 18:11:39 579人浏览独家记忆

摘要

目录前言excel 表格文件到底是什么js 实现步骤ZIP 解压XML 解析总结前言今天来聊一聊如何使用 JS 来解析 excel 文件，当然不是直接使用 exceljs、shee

前言

今天来聊一聊如何使用 JS 来解析 excel 文件，当然不是直接使用 exceljs、sheetjs 之类的库，那就没意思了，而是主要说一下 JS 解析 excel 表格是如何实现的。

注意本文主要讨论 xlsx 格式的 excel 表格，其它格式未探究并不清楚。

excel 表格文件到底是什么

首先要解析 excel 文件，得先了解他是如何存储数据的，经过我百般搜索，终于在 GG 中找到了答案：excel 文件其实是一个 zip 包！于是我赶紧新建了一个 xlsx 文件，在其中新建了两个 sheet 表，两个 sheet 表数据如下：

此为 sheet 1：

A	B	C
1		2
1		2



1		2
1		2

此为 sheet 2：

A	B
q	a
q	a
q	a

然后使用 zip 进行解压：

unzip test.xlsx -d test

然后通过 tree 我们就拿到这样一个目录结构：

test
├── [Content_Types].xml
├── _rels
├── docProps
│ ├── app.xml
│ ├── core.xml
│ └── custom.xml
└── xl
├── _rels
│ └── workbook.xml.rels
├── sharedStrings.xml
├── styles.xml
├── theme
│ └── theme1.xml
├── workbook.xml
└── worksheets
├── sheet1.xml
└── sheet2.xml

啊哈，干得漂亮，居然全都是 xml 文件。

我们在打开 xml 一探究竟，可以看出有几个文件很显眼，就是 worksheets 下的 sheet1.xml 和 sheet2.xml，还有 workbook.xml，其他的 styles、theme 一看就是和样式有关系，_rels 感觉就是什么内部引用，我们先看看两个 sheet 的 xml 文件，看看猜测是否正确，贴下 sheet1.xml：

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<worksheet xmlns="Http://schemas.openxmlfORMats.org/spreadsheetml/2006/main"
    xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships"
    xmlns:xdr="http://schemas.openxmlformats.org/drawingml/2006/spreadsheetDrawing"
    xmlns:x14="http://schemas.microsoft.com/office/spreadsheetml/2009/9/main"
    xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
    xmlns:etc="http://www.wps.cn/officeDocument/2017/etCustomData">
    <sheetPr/>
    <dimension ref="A1:C7"/>
    <sheetViews>
        <sheetView workbookViewId="0">
            <selection activeCell="D5" sqref="A3:D5"/>
        </sheetView>
    </sheetViews>
    <sheetFormatPr defaultColWidth="9.23076923076923" defaultRowHeight="16.8" outlineLevelRow="6" outlineLevelCol="2"/>
    <sheetData>
        <row r="1" spans="1:3">
            <c r="A1">
                <v>1</v>
            </c>
            <c r="C1">
                <v>2</v>
            </c>
        </row>
        <row r="2" spans="1:3">
            <c r="A2">
                <v>1</v>
            </c>
            <c r="C2">
                <v>2</v>
            </c>
        </row>
        <row r="6" spans="1:3">
            <c r="A6">
                <v>1</v>
            </c>
            <c r="C6">
                <v>2</v>
            </c>
        </row>
        <row r="7" spans="1:3">
            <c r="A7">
                <v>1</v>
            </c>
            <c r="C7">
                <v>2</v>
            </c>
        </row>
    </sheetData>
    <pageMargins left="0.75" right="0.75" top="1" bottom="1" header="0.5" footer="0.5"/>
    <headerFooter/>
</worksheet>

? 相信大家已经看出来了，sheetData 就是 excel 表格中的数据了，<row> 代表行，其中的 r 则是行数索引，row 中的 <c> 应该是 cell 了，其中的 <v> 对应着 cell 中的值，而 r 则是 cell 的位置，如 A7 代表着在 A 列 7 行。

此外还有几个很明显的属性如 dimension 可以看出是表格的大小范围，从 A1 cell 到 C7 cell 形成一个框。<sheetViews> 中存储的应该是页面中的信息，<selection> 代表的应该就是被选中的表格内容了。

而 workbook 中存储的则是 sheet 的信息：

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<workbook xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main"
    xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships">
    <fileVersion appName="xl" lastEdited="3" lowestEdited="5" rupBuild="9302"/>
    <workbookPr/>
    <bookViews>
        <workbookView windowHeight="16360" activeTab="1"/>
    </bookViews>
    <sheets>
        <sheet name="Sheet1" sheetId="1" r:id="rId1"/>
        <sheet name="Sheet2" sheetId="2" r:id="rId2"/>
    </sheets>
    <calcPr calcId="144525"/>
</workbook>

剩下的几个 xml，大概看了一眼，存储的信息还算很清楚，比如：

app 中存储了文件程序的信息，好像还有文件名
core 中保存了作者的信息和创建、修改时间
rels 文件也是 xml 格式，存储了一些其它 xml 的引用
theme 里存储了表格中定义的颜色、字体
[Content_Types] 里则是所有文件的引用，猜测估计为解析的入口文件

JS 实现步骤

知道了 excel 文件是如何存储数据的，那我们如何用 js 来解析它就很清楚了，主要分三步：

使用 js 解压缩 excel 文件
获取到其中的 sheet 文件内容，然后将 xml 数据解析出来
将数据转换成我们想要的形状

说干就干，那我们来实操一下：

ZIP 解压

关于 JS 如何实现 ZIP 解压的，上一篇文章也有提到，这里我们就不细说，直接使用 jszip 搞定：

document.querySelector('#file').addEventListener('change', async e => {
    const file = e.target.files[0];
    if (!file) return;
    const zip = await JSZip.loadAsync(file);
    const sheetXML = await zip.files['xl/worksheets/sheet1.xml'].async('string');
});

快速搞定，现在 sheetXML 就是我们刚刚看到的 sheet1.xml 中的数据了。

XML 解析

然后我们即可解析 XML 内容将其中数据取出，xml 解析原理很简单，和 html parse 一样，了解原理咱就直接随便搞个开源库帮忙搞定：

import convert from 'xml-js';

const result = convert.xml2JSON(sheetXML, { compact: true, spaces: 4 });

然后我们就得到了这样一串 JSON（删除了部分内容）：

{
    "_declaration": {
        "_attributes": {}
    },
    "worksheet": {
        "_attributes": {},
        "sheetPr": {},
        "dimension": {
            "_attributes": {
                "ref": "A1:C7"
            }
        },
        "sheetData": {
            "row": [
                {
                    "_attributes": {
                        "r": "1",
                        "spans": "1:3"
                    },
                    "c": [
                        {
                            "_attributes": {
                                "r": "A1"
                            },
                            "v": {
                                "_text": "1"
                            }
                        },
                        {
                            "_attributes": {
                                "r": "C1"
                            },
                            "v": {
                                "_text": "2"
                            }
                        }
                    ]
                },
                {
                    "_attributes": {
                        "r": "7",
                        "spans": "1:3"
                    },
                    "c": [
                        {
                            "_attributes": {
                                "r": "A7"
                            },
                            "v": {
                                "_text": "1"
                            }
                        },
                        {
                            "_attributes": {
                                "r": "C7"
                            },
                            "v": {
                                "_text": "2"
                            }
                        }
                    ]
                }
            ]
        }
    }
}

接下来，我们只需要将 sheetData 中的数据取出，然后按照内部的属性生成自己想要的数据格式即可。

总结

excel 文件本质就是一个 zip 包，我们只需要通过 zip 解压、xml 解析、数据处理这三个步骤，即可使用 JS 读取到其中的数据，当然其中的细节还是很多的，不过如果只是简单的 excel 模版，不妨自己尝试一下。

到此这篇关于使用JS解析excel文件的文章就介绍到这了,更多相关JS解析excel文件内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 使用JS解析excel文件的完整实现步骤

本文链接: https://www.lsjlt.com/news/169458.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

使用JS解析excel文件的完整实现步骤

目录前言excel 表格文件到底是什么JS 实现步骤ZIP 解压XML 解析总结前言今天来聊一聊如何使用 JS 来解析 excel 文件，当然不是直接使用 exceljs、shee...

99+

2022-11-13

js excel解析 js处理excel文件 Excel文件解析
node环境执行js文件的完整步骤

目录1、JavaScript代码的执行2、Node的REPL3、Node程序执行参数传递总结1、JavaScript代码的执行目前知道的两种方式有两种：将代码交给浏览器（在浏览器...

99+

2023-02-03

node 执行js文件 nodejs 可执行文件 node执行js文件的命令是什么
js实现中文转拼音的完整步骤记录

使用js搞了一个中文转拼音的包，仓库地址可见：pinyin-pro 特色功能支持汉字、词语、句子多种格式输入获取获取拼音获取声母获取韵母 ...

99+

2024-04-02
js使用xlsx读取excel文件的详细步骤

目录下载安装插件文件基础获取文件对象读取文件数据读取Excel通过xlsx获取workbookWorkBook介绍读取WorkBook导出Excel生成sheet总结下载安装插件 n...

99+

2024-04-02
SpringBoot整合Minio实现上传文件的完整步骤记录

目录Minio安装 Minio使用docker安装拉取镜像启动使用9000端口登录控制台创建存储桶设置桶权限创建 Java 客户端依赖配置文件配置文件配置类创建 minio 客户端...

99+

2024-04-02
PHP编写实现微信扫码登录的完整步骤解析

PHP编写实现微信扫码登录的完整步骤解析一、引言微信扫码登录是一种便捷的用户认证方式，通过微信的扫码功能可以实现用户的快速登录。在本文中，我们将介绍如何使用PHP编写实现微信扫码登...

99+

2024-03-04

微信 php 扫码 php编写
图文讲解完全卸载SQL server2019的完整步骤

1.先停止关于SQL server的所有服务，找到红框中的目标进行停止，如果不停止，后期卸载会在卸载的时候中止。（win+r填入services.msc） 2，在搜索框搜索然后找到...

99+

2023-03-08

完全卸载sqlserver2019 完全卸载sqlserver sqlserver完全卸载
图文讲解完全卸载SQL server2019的完整步骤

1.先停止关于SQL server的所有服务，找到红框中的目标进行停止，如果不停止，后期卸载会在卸载的时候中止。（win+r填入services.msc） 2，在搜索框搜索然后找到控制面板进行卸载。先找到列表中的这个文...

99+

2023-03-08

完全卸载sqlserver2019 完全卸载sqlserver sqlserver完全卸载
python数据写入Excel文件中的实现步骤

目录一、导入excel表格文件处理函数二、创建excel表格类型文件三、在excel表格类型文件中建立一张sheet表单四、自定义列名五、将列属性元组col写进sheet表单中六、将...

99+

2024-04-02
C#中实现登录功能的完整步骤

1. 准备工作新建一个数据库StudentDB -- 使用master 数据库 use master go if exists(select *from sysda...

99+

2024-04-02
vue3使用vue-router的完整步骤记录

前言对于大多数单页应用程序而言，管理路由是一项必不可少的功能。随着新版本的Vue Router处于Alpha阶段，我们已经可以开始查看下一个版本的Vue中它是如何工作的。 Vue3...

99+

2024-04-02
Oracle 11g实现安全加固的完整步骤

前言数据库安全配置中，需要做相关的安全加固工作。以确认数据库的安全，但是，有些时候，操作不当或者数据库业务账号修改密码后，而程序的连接数据库的配置封装在jar里，如果jar内的连接数据库的配置信息没有做相...

99+

2024-04-02
js实现文件流式下载文件方法详解及完整代码

JS实现流式打包下载说明浏览器中的流式操作可以节省内存，扩大 JS 的应用边界，比如我们可以在浏览器里进行视频剪辑，而不用担心视频文件将内存撑爆。浏览器虽然有...

99+

2022-12-10

js实现文件流下载 js实现文件下载 js实现大文件下载 js下载文件 js文件流下载 js下载文件源码 js文件流下载源码
C++ 使用CRC32检测内存映像完整性的实现步骤

目录仅对.text代码段进行校验：仅对.text代码段进行校验：通常程序中至少包括了代码段，数据段，而数据段中所存储的数据是经常会发生变动的，例如我们的全局变量，静态变量等都会默认...

99+

2024-04-02
Java实现画图的详细步骤（完整代码）

一、导入依赖 <dependency> <groupId>net.coobird</groupId> <artifactId...

99+

2024-04-02
vue实现移动端适方案的完整步骤

vue实现移动端适配步骤如下: 先安装amfe-flexible和postcss-pxtorem： npm install amfe-flexible --save npm inst...

99+

2022-11-13

vue实现移动端适配方案 Vue移动端适配 vue如何适配移动端
python实现地牢迷宫生成的完整步骤

目录基本属性生成房间生成墙壁生成门口生成通道总结基本属性定义当前地牢的等级，地图长宽，房间数量，房间的最小最大长度，如下 class Map: def __...

99+

2024-04-02
Vue使用echarts的完整步骤及解决各种报错

前言： Echarts，它是一个与框架无关的 JS 图表库，但是它基于Js，这样很多框架都能使用它，例如Vue，估计IONIC也能用，下次研究。因为我的习惯，每次新尝试做一个功能的...

99+

2024-04-02
Minio设置文件链接永久有效的完整步骤

目录前言1.下载MinIO Client2.运行MinIO Client3.添加一个云存储服务4.验证5.policy命令 - 管理存储桶策略总结前言 minio分享文件的链接，最多...

99+

2024-04-02
Java实现简易扑克牌游戏的完整步骤

本篇内容主要讲解“Java实现简易扑克牌游戏的完整步骤”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Java实现简易扑克牌游戏的完整步骤”吧!Java的特点有哪些Java的特点有哪些1.Java...

99+

2023-06-14