iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >java词法分析器DDL递归应用详解
  • 502
分享到

java词法分析器DDL递归应用详解

2024-04-02 19:04:59 502人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

目录前言intellij plugin词法解析状态迁移DDL 解析递归解析总结前言 最近大部分时间都在撸python,其中也会涉及到将数据库表转换为Python中ORM框架的Mode

前言

最近大部分时间都在撸python,其中也会涉及到将数据库表转换为PythonORM框架Model,但我们并没有找到一个合适的工具来做这个意义不大的”体力活“,所以每次新建表后大家都是根据自己的表结构手写一遍Model

一两张表还好,一旦 10 几张表都要写一遍时那痛苦只有自己知道;这时程序员的 slogan 再次印证:一切毫无意义的体力劳动终将被计算机取代。

intellij plugin

既然没有现成的工具那就自己写一个吧,演示效果如下:

考虑到我们主要是用PyCharm开发,正好jetbrains也提供了SDK用于开发插件,所以UI层面可以不用额外考虑了。

使用流程很简单,只需要导入DDL语句就可以生成Python所需要的Model代码。

例如导入以下 DDL:

CREATE TABLE `user` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `userName` varchar(20) DEFAULT NULL COMMENT '用户名',
  `passWord` varchar(100) DEFAULT NULL COMMENT '密码',
  `roleId` int(11) DEFAULT NULL COMMENT '角色ID',
  PRIMARY KEY (`id`),  
) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8

便会生成对应的 Python 代码:

class User(db.Model):
    __tablename__ = 'user'
    id = db.Column(db.Integer, primary_key=True, autoincrement=True)
    userName = db.Column(db.String)  # 用户名
    password = db.Column(db.String)  # 密码
    roleId = db.Column(db.Integer)  # 角色ID

词法解析

仔细对比源文件及目标代码会很容易找出规律,无非就是解析出表名、字段、及字段的属性(是否为主键、类型、长度),最后再转换为Python所需要的模板即可。

在我动手之前我认为是非常简单的,无非就是解析字符串,但实际上手后发现不是那么回事;主要是有以下几个问题:

  • 如何识别出表名称?
  • 同样的如何识别出字段名称,同时还得关联上该字段的类型、长度、注释。
  • 如何识别出主键?

总结一句话,如何通过一系列规则识别出一段字符串中的关键信息,这同样也是 MySQL Server 所做的事情。

在开始真正解析 DDL 之前,先来看下一段简单的脚本如何解析:

x = 20

按照我们平时开发的经验,这条语句分为以下几部分:

  • x表示变量
  • =表示赋值符号
  • 20表示赋值结果

所以我们对这段脚本的解析结果应当为:

VAR x

GE =

VAL 100

这个解析过程在编译原理中称为”词法解析“,可能大家听到编译原理这几个字就头大(我也是);对于刚才那段脚本我们可以编写一个非常简单的词法解析器生成这样的结果。

状态迁移

再开始之前先捋一下思路,可以看到上文的结果中通过VAR表示变量、GE表示赋值符号 ”=“、VAL表示赋值结果,现在需要重点记住这三个状态。

在依次读取字符解析时,程序就是在这几个状态中来回切换,如下图:

  • 默认为初始状态。
  • 当字符为字母时进入VAR状态。
  • 当字符为 ”=“ 符号时进入GE状态。

同理,当不满足这几个状态时候又会回到初始从而再次确认新的状态。

光看图有点抽象,直接来看核心代码:

public class Result{
    public TokenType tokenType ;
    public StringBuilder text = new StringBuilder();
}

首先定义了一个结果类,收集最终的解析结果;其中的TokenType就对应了图中的三种状态,简单的用枚举值来表示。

public enum TokenType {
    INIT,
    VAR,
    GE,
    VAL
}

首先对应到第一张图:初始化状态。

需要对当前解析的字符定义一个TokenType

和图中描述的流程一致,判断当前字符给定一个状态即可。

接着对应到第二张图:状态之间的转换。

会根据不同的状态进入不同的case,在不同的case中判断是否应当跳转到其他状态(进入INIT状态后会重新生成状态)。

举个例子:x = 20:

首选会进入VAR状态,接着下一个字符为空格,自然在 38 行中重新进入初始状态,导致再次确定下一个字符=进入GE状态。

当脚本为ab = 30:
第一个字符为 a 也是进入VAR状态,第二个字符为 b,依然为字母,所以进入 36 行,状态不会改变,同时将 b 这个字符追加进来;后续步骤就和上一个例子一致了。

多说无益,建议大家自己跑一下单测就会明白:

https://GitHub.com/crossoverJie/sqlalchemy-transfer/blob/master/src/test/java/top/crossoverjie/plugin/core/lab/TestLexerTest.java

DDL 解析

简单的解析完成后来看看DDL这样的脚本应当如何解析:

CREATE TABLE `user` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `userName` varchar(20) DEFAULT NULL COMMENT '用户名',
  `password` varchar(100) DEFAULT NULL COMMENT '密码',
  `roleId` int(11) DEFAULT NULL COMMENT '角色ID',
  PRIMARY KEY (`id`),  
) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8

原理类似,首先还是要看出规律(也就是语法):

  • 表名是第一行语句,同时以CREATE TABLE开头。
  • 每一个字段的信息(名称、类型、长度、备注)都是以 “`” 符号开头 “,” 结尾。
  • 主键是以 PRIMART 字符串开头的字段,以)结尾。

根据我们需要解析的数据种类,我这里定义了这个枚举:

然后在初始化类型时进行判断赋值:

由于需要解析的数据不少,所以这里的判断条件自然也就多了。

递归解析

针对于DDL的语法规则,我们这里还有需要有特殊处理的地方;比如解析具体字段信息时如何关联起来?

举个例子:

`userName` varchar(20) DEFAULT NULL COMMENT '用户名',
`password` varchar(100) DEFAULT NULL COMMENT '密码',

这里我们解析出来的数据得有一个映射关系:

所以我们只能一个字段的全部信息解析完成并且关联好之后才能解析下一个字段。

于是这里我采用了递归的方式进行解析(不一定是最好的,欢迎大家提出更优的方案)。

} else if (value == '`' && pStatus == Status.BASE_INIT) {
    result.tokenType = DDLTokenType.FI;
    result.text.append(value);
}

当当前字符为 ”`“ 符号时,将状态置为 “FI”(FieldInfo),同时当解析到为 “,” 符号时便进入递归处理。

可以理解为将这一段字符串单独提取出来处理:

`userName` varchar(20) DEFAULT NULL COMMENT '用户名',

接着再将这段字符递归调用当前方法再次进行解析,这时便按照字段名称、类型、长度、注释的规则解析即可。

同时既然存在递归,还需要将子递归的数据关联起来,所以我在返回结果中新增了一个pid的字段,这个也容易理解。

默认值为 0,一旦递归后便自增 +1,保证每次递归的数据都是唯一的。

用同样的方法在解析主键时也是先将整个字符串提取出来:

PRIMARY KEY (`id`)

只不过是 “P” 打头 “)” 结尾。

} else if (value == 'P' && pStatus == Status.BASE_INIT) {
    result.tokenType = DDLTokenType.P_K;
    result.text.append(value);
}

也是将整段字符串递归解析,再递归的过程中进行状态切换P_K ---> P_K_V最终获取到主键。

所以通过对刚才那段DDL解析得到的结果如下:

这样每个字段也通过了pid进行了区分关联。

所以现在只需要对这个词法解析器进行封装,便可以提供一个简单的api来获取表中的数据了。

总结

到此整个词法解析器的全部内容都已经完成了,虽然实现的是一个小功能,但我自己花的时间可不少,其中光复习编译原理就让人头疼。

但这还只是整个编译语言知识点的冰山一角,后续还有语法、语义、中间、目标代码等一系列内容,都是一个比一个难啃。

本文所有源码及插件地址:

Https://github.com/crossoverJie/sqlalchemy-transfer

以上就是java词法分析器DDL递归应用详解的详细内容,更多关于java DDL递归词法分析器的资料请关注编程网其它相关文章!

--结束END--

本文标题: java词法分析器DDL递归应用详解

本文链接: https://www.lsjlt.com/news/164247.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • java词法分析器DDL递归应用详解
    目录前言intellij plugin词法解析状态迁移DDL 解析递归解析总结前言 最近大部分时间都在撸Python,其中也会涉及到将数据库表转换为Python中ORM框架的Mode...
    99+
    2024-04-02
  • java词法分析器DDL递归怎么应用
    这篇文章主要讲解了“java词法分析器DDL递归怎么应用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“java词法分析器DDL递归怎么应用”吧!intellij plugin考虑到我们主要是...
    99+
    2023-07-02
  • C++ 函数递归详解:分治法中的递归应用
    递归是一种函数自我调用的技术,适用于可分解成较小规模子问题的问题。分治法采用递归将问题分解成独立子问题,逐步解决。如 findmaximum() 函数递归查找数组中最大值,通过检查基本情...
    99+
    2024-05-03
    c++ 递归
  • Java递归算法详解
    递归算法是一种通过调用自身来解决问题的方法。在Java中,递归算法通常有以下几个要素:1. 基本情况:递归方法必须有一个基本情况,即...
    99+
    2023-09-14
    Java
  • C++ 函数递归详解:递归的复杂度分析
    递归是一种函数调用自身的过程。递归的时间复杂度可以通过计算递归调用次数来分析,例如阶乘函数为 o(n^2),斐波那契数列第 n 项的递归函数为 o(φ^n),其中 φ 是黄金比。 C+...
    99+
    2024-05-04
    c++ 函数递归
  • Java的递归算法详解
    目录一、介绍1、介绍2、案例二、迷宫问题三、八皇后问题四、汉诺塔问题1、问题2、思想3、代码总结一、介绍 1、介绍 递归:递归就是方法自己调用自己,每次调用时传入不同的变量。递归有助...
    99+
    2024-04-02
  • Java 递归重难点分析详解与练习
    目录递归是什么分析递归的过程递归练习按顺序打印一个数的每一位递归是什么 就是一个方法在执行的时候,自己调用自己。 递归的要求: 1 有一个趋近于终止的条件 2 实现递归要去推导出一个...
    99+
    2024-04-02
  • java递归算法怎么应用
    Java递归算法可以应用于以下场景:1. 阶乘计算:递归可以用来计算一个数的阶乘。例如,计算n的阶乘可以定义为f(n) = n * ...
    99+
    2023-08-09
    java
  • 全面分析Java方法的使用与递归
    目录java中方法的使用什么是方法方法的定义与使用方法如何进行调用及其方法调用过程方法的形参和实参方法重载方法签名递归java中方法的使用 什么是方法 举一个日常生活中的例子,比如我...
    99+
    2024-04-02
  • Java方法递归的形式和常见递归算法代码分析
    本篇内容介绍了“Java方法递归的形式和常见递归算法代码分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!方法递归方法递归的形式什么是方法递...
    99+
    2023-07-05
  • Java方法递归的思路详解
    目录前言一、什么是方法递归二、什么场景下能用递归三、如何写出递归代码-重点总结前言 今天给老铁们回顾一下递归的思路以及方法,也是给自己的一个归纳总结。 一、什么是方法递归 所谓的方法...
    99+
    2024-04-02
  • Java开发深入分析讲解二叉树的递归和非递归遍历方法
    目录前言1.递归遍历2.非迭代遍历3.二叉树的统一迭代法前言 二叉树的遍历方法分为前序遍历,中序遍历,后续遍历,层序遍历。 1.递归遍历 对于递归,就不得不说递归三要素:以前序遍历...
    99+
    2024-04-02
  • C++ 函数递归详解:递归在编程竞赛中的应用
    递归是一种函数自调用技术,它基于更小的实例解决问题,然后组合结果解决原始问题。其优点包括代码简洁和解决自相似问题的能力,缺点是可能导致堆栈溢出。斐波那契数列等问题可以通过递归函数轻松计算...
    99+
    2024-05-04
    c++ 递归 堆栈溢出
  • Java用递归方法解决汉诺塔问题详解
    目录前言一、问题描述二、问题分析三、解决方案四、示例前言 博主之前有写过关于递归问题的思维模式: 递归的思路 下面将用这种思维模式来求解经典汉诺塔问题。 一、问题描述 汉诺塔(又称河...
    99+
    2024-04-02
  • Java与C++分别用递归实现汉诺塔详解
    目录1.汉诺塔介绍2.解塔步骤3.C++实现(递归结果及显示步骤)(1)递归结果(2)显示步骤4.Java实现(递归结果及显示步骤)(1)递归结果(2)显示步骤1.汉诺塔介绍 汉诺...
    99+
    2024-04-02
  • C++ 函数递归详解:递归在字符串处理中的应用
    递归函数是一种在字符串处理中反复调用自身来解决问题的技术。它需要一个终止条件以防止无限递归。递归在字符串反转和回文检查等操作中被广泛使用。 C++ 函数递归详解:递归在字符串处理中的应...
    99+
    2024-04-30
    c++ 递归
  • C++ 函数的递归实现:递归在语言分析中的应用示例?
    递归是一种函数在自身内部调用自身的编程范式。在 c++++ 中,可使用 operator() 运算符实现递归。递归在语言分析中可用作分析嵌套结构的工具,例如识别括号序列的合法性:如果序列...
    99+
    2024-04-22
    函数 c++ 递归
  • java迷宫算法的理解(递归分割,递归回溯,深搜,广搜)
    目录递归分割法:递归回溯法:广度优先深度优先:下面是递归分割法、递归回溯法以及文件加载地图实现的类map最近这学期做了一个java迷宫的课程设计,这里代码及其算法逻辑就分享出来。 首...
    99+
    2024-04-02
  • java全排列递归算法怎么应用
    全排列是一种经典的组合数学问题,递归算法可以很好地解决该问题。下面是一种Java递归算法实现全排列的例子:```javaimport...
    99+
    2023-09-23
    java
  • Java递归算法详解(动力节点整理)
    递归算法是一种直接或者间接调用自身函数或者方法的算法。Java递归算法是基于Java语言实现的递归算法。递归算法的实质是把问题分解成规模缩小的同类问题的子问题,然后递归调用方法来表示问题的解。递归算法对解决一大类问题很有效,它可以使算法简洁...
    99+
    2023-05-31
    java 递归 ava
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作