广告
返回顶部
首页 > 资讯 > 后端开发 > JAVA >java过滤乱码(u形式乱码、unicode乱码)
  • 481
分享到

java过滤乱码(u形式乱码、unicode乱码)

java乱码 2018-05-02 00:05:29 481人浏览 无得
摘要

由于编辑人员从excel,Word等乱七八糟的地方copy内容过来,其中有不可见的字符,导致输出内容看上去是对的,其实是多了一个零长度的字符(比如:u2028,0000200B ZERO WIDTH SPACE),所以需要过滤掉不合法的un

由于编辑人员从excelWord等乱七八糟的地方copy内容过来,其中有不可见的字符,导致输出内容看上去是对的,其实是多了一个零长度的字符(比如:u2028,0000200B ZERO WIDTH SPACE),所以需要过滤掉不合法的unicode编码等特殊字符

整理的正则:

[\u007f-\u009f]|\u00ad|[\u0483-\u0489]|[\u0559-\u055a]|\u058a|[\u0591-\u05bd]|\u05bf|[\u05c1-\u05c2]|[\u05c4-\u05c7]|[\u0606-\u060a]|[\u063b-\u063f]|\u0674|[\u06e5-\u06e6]|\u070f|[\u076e-\u077f]|\u0a51|\u0a75|\u0b44|[\u0b62-\u0b63]|[\u0c62-\u0c63]|[\u0ce2-\u0ce3]|[\u0d62-\u0d63]|\u135f|[\u200b-\u200f]|[\u2028-\u202e]|\u2044|\u2071|[\uf701-\uf70e]|[\uf710-\uf71a]|\ufb1e|[\ufc5e-\ufc62]|\ufeff|\ufffc

java代码如下:

private String replaceWrongUnicode(String source, String replace) {
        if (StringUtils.isBlank(source)) {
            return source;
        }
        if (StringUtils.isBlank(replace)) {
            replace = "";
        }
        Pattern CRLF = Pattern.compile("([\u007f-\u009f]|\u00ad|[\u0483-\u0489]|[\u0559-\u055a]|\u058a|[\u0591-\u05bd]|\u05bf|[\u05c1-\u05c2]|[\u05c4-\u05c7]|[\u0606-\u060a]|[\u063b-\u063f]|\u0674|[\u06e5-\u06e6]|\u070f|[\u076e-\u077f]|\u0a51|\u0a75|\u0b44|[\u0b62-\u0b63]|[\u0c62-\u0c63]|[\u0ce2-\u0ce3]|[\u0d62-\u0d63]|\u135f|[\u200b-\u200f]|[\u2028-\u202e]|\u2044|\u2071|[\uf701-\uf70e]|[\uf710-\uf71a]|\ufb1e|[\ufc5e-\ufc62]|\ufeff|\ufffc)");
        Matcher m = CRLF.matcher(source);
        if (m.find()) {
            return m.replaceAll(replace);
        }
        return source;
    }

附:过滤 成

private String replaceEnter(String source) {
        if (StringUtils.isBlank(source)) {
            return source;
        }
        Pattern CRLF = Pattern.compile("(
||
|
)");
        Matcher m = CRLF.matcher(source);
        if (m.find()) {
            return m.replaceAll("
"); } return source; }

更多java知识请关注Java基础教程栏目。

--结束END--

本文标题: java过滤乱码(u形式乱码、unicode乱码)

本文链接: https://www.lsjlt.com/news/2100.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • java过滤乱码(u形式乱码、unicode乱码)
    由于编辑人员从excel,word等乱七八糟的地方copy内容过来,其中有不可见的字符,导致输出内容看上去是对的,其实是多了一个零长度的字符(比如:u2028,0000200B ZERO WIDTH SPACE),所以需要过滤掉不合法的un...
    99+
    2018-05-02
    java 乱码
  • Java中怎么过滤中文乱码
    Java中怎么过滤中文乱码,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1. Unicode编码Unicode编码是一种涵盖了世界上所有语言、标点等字符的编码方式,简单一点...
    99+
    2023-06-02
  • java socket乱码
    java socket乱码解决方法:首先在服务端使用InputStreamReader指定客户端的输入流为utf-8编码,以及使用OutputStreamWriter指定输出流为utf-8编码;然后在客户端同样的设置utf-8编码即可。in...
    99+
    2018-03-10
    java基础 java socket 乱码
  • java string乱码
    java string乱码问题出在预发、生产和本地环境的系统编码方式不一致,本地系统默认是UTF-8,而预发、生产环境默认是GBK编码,因此导致出现乱码。如果不指定编码方式,则默认以系统的编码方式。String csn = Charset....
    99+
    2018-07-22
    java基础 java string 乱码
  • java压缩乱码
    java压缩乱码通常用java来打包文件生成压缩文件后会出现内容的中文乱码问题,这个问题网上很多人给出了解决方法,主要有两种方法:一是修改sun的源码;二是使用开源的类库org.apache.tools.zip.ZipOutputStrea...
    99+
    2019-09-13
    java基础 java 压缩乱码
  • java url参数乱码
    如果URL中文参数乱码的话,可以尝试:方法1:(java) 第一个页面拼接URL 参数的时候用:URLEncoder.encode(参数, "UTF-8")第二个页面从request中获取该参数值 =new String(request.g...
    99+
    2020-10-11
    java基础 java 乱码
  • java插入mysql乱码
    java插入mysql乱码java插入数据到mysql分为三层:● 前端页面● 后台代码● 数据库这三层任意一层乱码都不行,所以我们需要对着三层逐一设置编码格式,保存编码统一就不会乱码了。详解三层编码设置解决乱码问题1、前端前端就是设置页面...
    99+
    2020-07-07
    java基础 java 数据库 乱码
  • JAVA中文与乱码
    Tomcat默认字符集为ISO-8859-1,是不支持中文。所以中文都会显示成乱码。解决的需要将ISO-8859-1转换成UTF-8。一、对于Post请求request.setCharacterEncoding("UTF-8&qu...
    99+
    2023-06-02
  • java中rsa乱码介绍
    在对安全性要求比较高的报文做加密的时候,算法有很多种,我这里主要用到的就是AES加密算法。由于在国内使用,所以不可避免的要对中文进行加密和解密,而在这个过程中,发现,如果不做处理,很容易会出现中文乱码。(推荐:java视频教程)下面是常见的...
    99+
    2021-01-19
    java
  • Linux中菱形乱码怎么修改
    小编给大家分享一下 Linux中菱形乱码怎么修改,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!Linux菱形乱码的解决方案:执行命令:vim /var/lib/l...
    99+
    2023-06-12
  • java utf-8 乱码怎么办
    java utf-8 乱码怎么办?在html首部编写如下代码:推荐教程:《java学习》 示例如下: login.jsp 姓名: 密码: 若不...
    99+
    2017-03-29
    java
  • eclipse java 乱码怎么解决
    eclipse项目代码显示中文乱码解决方法有4种:1、设置工作空间的编码方式进行点击菜单中的windows菜单选择下拉菜单中进行选择为Preferences选项。进入general的选项,选中workspace的选项,点击Apply,点击O...
    99+
    2018-05-03
    java入门 eclipse java 乱码
  • java控制台出现乱码
    java资源的编码都是utf8,使用utf8编译。但是控制台输出的时候,中文汉字还是会出现乱码。eclipse控制台eclipse控制台的编码默认为操作系统的编码,比如GBK。这时候就不能正确显示utf8编码的汉字,需要指定控制台的编码为u...
    99+
    2021-11-28
    java基础 java 控制台 乱码
  • java写入文件是乱码
    java写入文件是乱码我们读取、写入文件流时,经常会遇到乱码的现象,造成乱码的原因当然不可能是一个,这里主要介绍因为文件编码格式而导致的乱码的问题。首先,明确一点,文本文件与二进制文件的概念与差异。文本文件是基于字符编码的文件,常见的编码有...
    99+
    2014-07-17
    java 写入文件 乱码
  • java servlet乱码怎么解决
    Java Servlet 是运行在 Web 服务器或应用服务器上的程序,它是作为来自 Web 浏览器或其他 HTTP 客户端的请求和 HTTP 服务器上的数据库或应用程序之间的中间层。使用 Servlet,您可以收集来自网页表单的用户输入,...
    99+
    2019-10-24
    java
  • java web乱码解决方法
    设置文件的保存编码格式,这个一般在新建项目时,设置了GBK的编码格式,这时文件的页面编码格式是GBK的,而保存格式是ANSI的,后来把项目及文件的编码格式改为utf-8的编码格式后,依然出现中文乱码,这就是因为已经存在的文件的保存编码格式还...
    99+
    2014-05-26
    java 乱码
  • java读取txt中文乱码
    java读取txt文本中如含有中文,可能会出现乱码,解决方案是: 要统一编码,java工程的编码,txt文本编码,java工程中的java文本编码都统一为utf-8; 利用 InputStreamReader(new FileInputSt...
    99+
    2016-12-29
    java基础 java 乱码
  • 怎么在U盘中删除乱码文件
    这篇文章主要介绍了怎么在U盘中删除乱码文件,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。方法/步骤一:打开计算机管理器窗口,随后在磁盘管理中找到U盘。右键选中后开始进行格式化...
    99+
    2023-06-27
  • java项目中如何使用 web过滤器对乱码进行处理
    本篇文章为大家展示了java项目中如何使用 web过滤器对乱码进行处理,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。我们在servlet页面中读取前台的数据时  经常会出现乱码问题而自己每...
    99+
    2023-05-31
    java web过滤器 乱码
  • 通过bash/cmd运行java项目出现乱码
    问题:无论在Java代码中如何统一编码为UTF8,在IDE中运行是完全没问题的,但打包成Jar通过Bash和CMD运行,都会出现中文乱码问题。原因:cmd/bash默认的编码是GBK。解决方法:一、设定cmd的编码为utf-8打开cmd,输...
    99+
    2016-07-07
    java基础 bash cmd java 运行 乱码
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作