广告
返回顶部
首页 > 资讯 > 后端开发 > Python >nlp词性标注的作用
  • 944
分享到

nlp词性标注的作用

词性作用nlp 2023-01-30 22:01:37 944人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

词性标注 – 除了语法关系,句中单词的位置(词性)标记也蕴含着信息,词的位置定义了它的用途和功能。宾夕法尼亚大学提供了一个完整的位置标记列表。下方代码则使用了NLTK库来对输入的文本进行词性标注。 from nltk import Wo

词性标注 – 除了语法关系,句中单词的位置(词性)标记也蕴含着信息,词的位置定义了它的用途和功能。宾夕法尼亚大学提供了一个完整的位置标记列表。下方代码则使用了NLTK库来对输入的文本进行词性标注。

from nltk import Word_tokenize, pos_tag
text = "I am learning Natural Language Processing on Analytics Vidhya"
tokens = word_tokenize(text)
print pos_tag(tokens)
>>> [('I', 'PRP'), ('am', 'VBP'), ('learning', 'VBG'), ('Natural', 
'NNP'),('Language', 'NNP'),('Processing', 'NNP'), ('on', 'IN'), 
('Analytics', 'NNP'),('Vidhya', 'NNP')]

NLP中,词性标注有个很多重要用途:

A.消除歧义: 一些词的不同用法代表不同的意思. 如下列两句:

I. “Please book my flight for Delhi”

II. “I am Going to read this book in the flight”

“Book” 在这里代表不同的意义, 好在它在两句的位置也不同. 第一句“book”是的动词, 第二句中它是个名词。 (Lesk Algorithm也被用于类似目的)

B.强化基于单词的特征: 一个机器学习模型可以从一个词的很多方面提取信息,但如果一个词已经标注了词性,那么它作为特征就能提供更精准的信息。 例如:

句子 -“book my flight, I will read this book”

单词 – (“book”, 2), (“my”, 1), (“flight”, 1), (“I”, 1), (“will”, 1), (“read”, 1), (“this”, 1)

带标注的单词 – (“book_VB”, 1), (“my_PRP$”, 1), (“flight_NN”, 1), (“I_PRP”, 1), (“will_MD”, 1), (“read_VB”, 1), (“this_DT”, 1), (“book_NN”, 1)

译者注:如果不带词性标注,两个“book”就被认为是同义词,词频为2。这会在后续分析中引入误差。

C.标准化与词形还原: 位置标注是词形还原的基础步骤之一,可以帮助把单词还原为基本形式.

D.有效移除停用词 : 利用位置标记可以有效地去除停用词。

 

--结束END--

本文标题: nlp词性标注的作用

本文链接: https://www.lsjlt.com/news/179284.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • nlp词性标注的作用
    词性标注 – 除了语法关系,句中单词的位置(词性)标记也蕴含着信息,词的位置定义了它的用途和功能。宾夕法尼亚大学提供了一个完整的位置标记列表。下方代码则使用了NLTK库来对输入的文本进行词性标注。 from nltk import wo...
    99+
    2023-01-30
    词性 作用 nlp
  • Python底层技术解析:如何实现分词和词性标注
    Python底层技术解析:如何实现分词和词性标注,需要具体代码示例在自然语言处理(NLP)中,分词和词性标注是一项非常重要的任务。分词是将连续的文字序列切分为单个词语的过程,而词性标注则是为每个词语确定其在文本中的词性,如名词、动词、形容词...
    99+
    2023-11-08
    Python 分词 词性标注
  • python怎么调用Hanlp做命名实体识别以及词性标注
    本篇内容介绍了“python怎么调用Hanlp做命名实体识别以及词性标注”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!pyhanlp只有少数...
    99+
    2023-06-02
  • nlp时间线的作用有哪些
    NLP(自然语言处理)时间线可以用于记录和分析文本数据中的时间信息,从而帮助理解和处理文本中的时间相关内容。以下是NLP时间线的一些...
    99+
    2023-10-08
    nlp
  • 使用torchtext导入NLP数据集的操作
    如果你是pytorch的用户,可能你会很熟悉pytorch生态圈中专门预处理图像数据集的torchvision库。 从torchtext这个名字我们也能大概猜到该库是pytorch圈...
    99+
    2022-11-12
  • Python如何制作个性化的词云图
    小编给大家分享一下Python如何制作个性化的词云图,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1. 引言词云图可以让我们方便地识别出文本中的关键词,其中单词的...
    99+
    2023-06-29
  • DEDECMS如何调用显示的tags标签词
    这篇文章将为大家详细讲解有关DEDECMS如何调用显示的tags标签词,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 CSS代码:.tag1 { c...
    99+
    2022-10-19
  • Python制作个性化的词云图实例讲解
    目录1. 引言2. 举个栗子2.1 安装stylecloud库2.2 生成词云图2.3 美化显示效果2.4 处理停用词2.5 使用自定义背景图像3. 总结1. 引言 词云图可以让我们...
    99+
    2022-11-13
  • 6.PL_SQL——注释、数据类型的转换、变量的范围和限定词标签
    一、PL/SQL块的词法        PL/SQL中可以使用字母、数字、空格和特殊符号等,主要包括:   ...
    99+
    2022-10-18
  • HTML标签的target属性有什么作用
    HTML标签的target属性用于指定链接的目标窗口或框架。它有以下几个常用的值:- _blank:在新窗口或标签页中打开链接。- ...
    99+
    2023-09-13
    HTML
  • Javalombok中@Accessors注解三个属性的作用
    Accessors翻译是存取器。通过该注解可以控制getter和setter方法的形式。 @Accessors(fluent = true) 使用fluent属性,getter和se...
    99+
    2023-05-20
    Java lombok lombok @Accessors @Accessors注解
  • 常见的html单词及作用有哪些
    这篇文章主要讲解了“常见的html单词及作用有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“常见的html单词及作用有哪些”吧! a、B(strong...
    99+
    2022-10-19
  • Kubernetes特别属性的标签Label的强大作用
    目录前言Label的匹配规则:前言 Label:对k8s中各种资源进行分类、分组,添加一个具有特别属性的标签 Selector:通过一个过滤的语法进行查找到对应标签的资源 Label...
    99+
    2022-11-13
  • Python标准库之typing的用法(类型标注)
    PEP 3107引入了功能注释的语法,PEP 484 加入了类型检查 标准库 typing 为类型提示指定的运行时提供支持。 示例: def f(a: str, b:int) -> str: ret...
    99+
    2022-06-02
    Python typing 类型标注
  • 浅析Python中yield关键词的作用与用法
    前言 为了理解yield是什么,首先要明白生成器(generator)是什么,在讲生成器之前先说说迭代器(iterator),当创建一个列表(list)时,你可以逐个的读取每一项,这就叫做迭代(iterat...
    99+
    2022-06-04
    关键词 作用 Python
  • 只用Python就可以制作的简单词云
    一、准备 词云制作所必需的三个包: 安装:pip install matplotlib 安装:pip install jieba 安装:pip install wordcloud...
    99+
    2022-11-12
  • Kubernetes特别属性的标签Label有什么作用
    今天小编给大家分享一下Kubernetes特别属性的标签Label有什么作用的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。前...
    99+
    2023-06-29
  • 常见的 HTML<meta> 标签的 name 属性及其作用
    HTML中的 标签可以通过 name 属性提供元数据,这些元数据可以用于指定有关文档的信息,以及控制浏览器和搜索引擎的行为。name 属性通常与其他属性一起使用,如 content、charset、http-equiv 等,以提供更具体的...
    99+
    2023-08-30
    html 前端
  • @Data注解的作用
    @Data 是 Lombok 中的一个注解,它可以自动生成以下代码: 所有字段的 get 和 set 方法。toString() 方法,用于将对象转换成字符串形式,便于日志输出和调试。hashCode() 方法,用于计算对象的哈希值。equ...
    99+
    2023-09-02
    java 开发语言
  • C#中使用jieba.NET、WordCloudSharp制作词云图的步骤
    词云简介 “词云”由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于2006年最先使用,是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的...
    99+
    2022-11-12
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作