广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python string中删除(过滤)
  • 875
分享到

Python string中删除(过滤)

Pythonstring 2023-01-31 02:01:22 875人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

最近做了一个需求,把公众号的用户信息同步到服务端,发现很多用户的昵称里面都有表情符号(emoji), 一般的处理方式是把Mysql的编码改成 utf8mb4,后来讨论了下,这些表情也没什么用,入库的时候直接删除就好了。 过滤

最近做了一个需求,把公众号的用户信息同步到服务端,发现很多用户的昵称里面都有表情符号(emoji), 一般的处理方式是把Mysql的编码改成 utf8mb4,后来讨论了下,这些表情也没什么用,入库的时候直接删除就好了。

过滤方法

python怎么过滤 emoji表情符号呢? 下面是剔除表情字符串的代码片段 Python2.7 下测试

import re

emoji_pattern = re.compile(
    u"(\ud83D[\ude00-\ude4f])|"  # emoticons
    u"(\ud83c[\udf00-\uffff])|"  # symbols & pictographs (1 of 2)
    u"(\ud83d[\u0000-\uddff])|"  # symbols & pictographs (2 of 2)
    u"(\ud83d[\ude80-\udeff])|"  # transport & map symbols
    u"(\ud83c[\udde0-\uddff])"  # flags (iOS)
    "+", flags=re.UNICODE)

def remove_emoji(text):
    return emoji_pattern.sub(r'', text)

参考 removing-emojis-from-a-string-in-python , 如果正则没有写对 还可以遇到 sre_constants.error: bad character range 之类的错误 。

这里根据 unicode 范围来删除表情符号,通用的和ioS中的,应该不是很全,也没找到非常全的list。后面证实还是有写过滤不掉,最好还是把字段改成utf8mb4。。如果有更全的过滤方法,欢迎分享

修改字符编码

不能完全过滤又要存储,只好修改 带有 emoji 表情字段 的编码设置 (mysql5.6测试)

ALTER TABLE `table_name` MODIFY `nickname` VARCHAR(40) CHARSET utf8mb4 COLLATE utf8mb4_unicode_ci;

因为Mysql 存储 utf8mb4 时候使用 4 个字节,比直接使用utf8占用的空间更多 charset-unicode-utf8mb4,所以请重新考虑下字段的长度 , 否则可能会出现 (1406, "Data too long for column 'nickname' at row 1") 之类的错误。

其他

  • js中怎样删除 emoji 表情符号

--结束END--

本文标题: Python string中删除(过滤)

本文链接: https://www.lsjlt.com/news/185711.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python string中删除(过滤)
    最近做了一个需求,把公众号的用户信息同步到服务端,发现很多用户的昵称里面都有表情符号(emoji), 一般的处理方式是把MySQL的编码改成 utf8mb4,后来讨论了下,这些表情也没什么用,入库的时候直接删除就好了。 过滤...
    99+
    2023-01-31
    Python string
  • vue3删除过滤器的原因
    目录什么是vue的过滤器why?举例分析需求描述HTML结构和data数据如下使用filter实现使用computed实现使用methods实现总结什么是vue的过滤器 过滤器可以...
    99+
    2022-11-12
  • EntityFrameworkCore实现软删除与查询过滤器
    注意:我使用的是 Entity Framework Core 2.0 (2.0.0-preview2-final)。正式版发布后,功能可能存在变动。 继续探索Entity Frame...
    99+
    2022-11-13
  • 使用jquery怎么过滤被删除的元素
    这篇文章给大家介绍使用jquery怎么过滤被删除的元素,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。jquery是什么jquery是一个简洁而快速的JavaScript库,它具有独特的链式语法和短小清晰的多功能接口、高...
    99+
    2023-06-14
  • Angular如何实现较为复杂的表格过滤,删除功能
    这篇文章主要介绍了Angular如何实现较为复杂的表格过滤,删除功能,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。具体如下:先来看看运行效果...
    99+
    2022-10-19
  • python中有哪些过滤器
    python中有哪些过滤器?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、...
    99+
    2023-06-14
  • Redis中过期键怎么删除
    这篇“Redis中过期键怎么删除”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Redis中过期键怎么删除”文章吧。前言Red...
    99+
    2023-06-30
  • String中删除空格的方法有哪些
    本篇内容主要讲解“String中删除空格的方法有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“String中删除空格的方法有哪些”吧!在java中从字符串中删除空格的不同方法首先,我们来看一...
    99+
    2023-06-27
  • Angular如何实现搜索、过滤、批量删除、添加、表单验证功能
    这篇文章将为大家详细讲解有关Angular如何实现搜索、过滤、批量删除、添加、表单验证功能,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。具体代码如下所示;<!DOC...
    99+
    2022-10-19
  • 怎么在python中停用词过滤
    这篇文章将为大家详细讲解有关怎么在python中停用词过滤,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。python有哪些常用库python常用的库:1.requesuts;2.scrapy...
    99+
    2023-06-14
  • Python中如何删除文件
    这篇“Python中如何删除文件”除了程序员外大部分人都不太理解,今天小编为了让大家更加理解“Python中如何删除文件”,给大家总结了以下内容,具有一定借鉴价值,内容详细步骤清晰,细节处理妥当,希望大家通过这篇文章有所收获,下面让我们一起...
    99+
    2023-06-14
  • Linux删除系统自带版本Python过程详解
    巨坑,切忌不要轻易删除Linux系统自带版本的Python 1.卸载python(防止未卸载干净) rpm -qa|grep python|xargs rpm -ev --allmatches --nodeps #...
    99+
    2022-06-03
    Linux 删除 系统自带 Python
  • Redis使用元素删除的布隆过滤器来解决缓存穿透问题
    目录前言缓存雪崩解决方案缓存击穿解决方案 缓存穿透解决方案布隆过滤器(Bloom Filter)什么是布隆过滤器位图(Bitmap)哈希碰撞布隆过滤器的2大特点fpp布隆过...
    99+
    2022-11-12
  • c语言中string怎么删除指定字符串
    在C语言中,可以使用以下方法删除指定的字符串:1. 使用strcpy()函数:可以先将指定字符串后面的字符串向前移动,然后使用str...
    99+
    2023-09-15
    c语言
  • Python中怎么过滤字符串列表
    今天就跟大家聊聊有关Python中怎么过滤字符串列表,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。使用另一个列表过滤字符串列表本示例说明了如何在不使用任何方法的情况下过滤字符串列表中...
    99+
    2023-06-16
  • Linux中怎么定时删除过期文件
    本篇文章为大家展示了Linux中怎么定时删除过期文件,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。在linux下删除过期文件,很简单,用如下命令:代码如下:find /var/www/ -type ...
    99+
    2023-06-13
  • Python 实现过滤掉列表中唯一值
    目录1、filter_unique2、collections.Counter3、列表推导式4、filter_non_unique 1、filter_unique from col...
    99+
    2022-11-12
  • Redis如何使用元素删除的布隆过滤器来解决缓存穿透问题
    这篇文章给大家分享的是有关Redis如何使用元素删除的布隆过滤器来解决缓存穿透问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言在我们日常开发中,Redis使用场景最多的就是作为缓存和分布式锁等功能来使用,而...
    99+
    2023-06-20
  • oracle中怎么删除过期的归档日志
    oracle中怎么删除过期的归档日志,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。1、对于 EXPIRED 状态的产生,相对于...
    99+
    2022-10-18
  • Redis中过期键如何删除示例详解
    目录前言Redis 中 key 的过期删除策略1、定时删除2、惰性删除3、定期删除Redis 中过期删除策略从库是否会脏读主库创建的过期键内存淘汰机制内存淘汰触发的最大内存有哪些内存...
    99+
    2022-11-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作