iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >使用Python进行线程编程
  • 243
分享到

使用Python进行线程编程

线程Python 2023-01-31 07:01:22 243人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

    对于python来说,并不缺少并发选项,其标准库包括了对线程、进程和异步I/O的支持。在许多情况下,通过创建诸如异步、线程和子进程之类的高层模块,Python简化了各种并发方法的使用。除了标准库之外,还有一些第三方的解决方案。例如T

    对于python来说,并不缺少并发选项,其标准库包括了对线程、进程和异步I/O的支持。在许多情况下,通过创建诸如异步、线程和子进程之类的高层模块,Python简化了各种并发方法的使用。除了标准库之外,还有一些第三方的解决方案。例如Twisted、Stackless和进程Module。因为GIL,CPU受限的应用程序无法从线程中受益。使用Python时,建议使用进程,或者混合创建进程和线程。

    首先弄清楚进程和线程的区别。线程和进程的不同之处在于,它们共享状态、内存和资源。对于线程来说,这个简单的区别既是它的优势,又是它的缺点。一方面,线程是轻量级的,并且相互之间易于通信,但另一方面,它们也带来了包括死、争用条件和好复杂性在内的各种问题。幸运的是,由于GIL和队列模块,与采用其他的语言相比,采用Python语言在线程实现的复杂性上要低的多。


一个简单的demo:

#!/usr/bin/env python
import Queue
import threading
import urllib2
import time

hosts = ["Http://www.baidu.com", "http://www.sina.com.cn", "http://www.letv.com"]

class ThreadUrl(threading.Thread):
    def __init__(self, queue):
        threading.Thread.__init__(self)
        self.queue = queue
        
    def run(self):
        while True:
            host = self.queue.get()
            url = urllib2.urlopen(host)
            print url.read(1024)
            self.queue.task_done()
            
def main():
    for i in range(5):
        t = ThreadUrl(queue)
        t.setDaemon(True)
        t.start()
    
    for host in hosts:
        queue.put(host)
    
    queue.join()

if __name__ == "__main__":
    start = time.time()
    main()
    print "Elapsed Time:%s" % (time.time() - start)

    在Python中使用线程时,这个模型是一种很常见的并且推荐使用的方式。具体工作步骤描述如下:

        1. 创建一个Queue.Queue()队列实例,然后向这个队列内灌数据。

        2. 将灌进数据的实例传递给线程类,然后通过继承threading.Thread的方式创建。

        3. 生成守护进程池(t.setDaemon(True))。

        4. 每次从queue中pop一个项目,并使用该线程中的数据和run方法以执行相应的工作。

        5. 在完成这项工作之后,使用queue.task_done()方法向任务完成的队列发送一个信号。

        6. 对队列执行join操作,实际上意味着等到queue为空,再退出主程序。


    在使用这个模式时需要注意一点:通过将守护线程设置为True,将允许主线程或者程序仅在守护线程处于活动状态时才能够退出。这种方式创建了一种简单的方式以控制程序流程,因为在退出之前,你可以对queue执行join操作或者等到队列为空。


说明:

    join():保持阻塞状态,直到处理了队列中的所有项目为止。在将一个项目添加到该队列时,未完成的任务的总数就会增加。当使用者线程调用task_done()以表示检索了该项目、并完成了所有的工作时,那么未完成的任务的总数就会减少。当未完成的任务的总数减少到零时,join()就会结束阻塞状态。

    

使用多队列:

    因为上面介绍的模式非常有效,所以可以通过连接附加线程池和队列来进行扩展,这是相当简单的。在上面的示例中,您仅仅输出了 WEB 页面的开始部分。而下一个示例则将返回各线程获取的完整 Web 页面,然后将结果放置到另一个队列中。然后,对加入到第二个队列中的另一个线程池进行设置,然后对 Web 页面执行相应的处理。这个示例中所进行的工作包括使用一个名为 Beautiful Soup 的第三方 Python 模块来解析 Web 页面。使用这个模块,您只需要两行代码就可以提取所访问的每个页面的 title 标记,并将其打印输出。


代码片段:

#!/usr/bin/env python
#-*- coding:utf-8 -*-

import Queue
import threading
import urllib2
import time
from BeautifulSoup import BeautifulSoup

hosts = ['http://www.baidu.com', 'http://www.letv.com', 'http://www.sina.com.cn', 'http://www.sohu.com', 'http://www.jd.com', 'http://WWW.51CTO.COM', 'http://www.baidu.com', 'http://www.sina.com.cn', 'http://www.sohu.com'] 

queue = Queue.Queue()
out_queue = Queue.Queue()

class ThreadUrl(threading.Thread):
    def __init__(self, queue, out_queue):
        threading.Thread.__init__(self)
        self.queue = queue
        self.out_queue = out_queue
    def run(self):
        while True:
            host = self.queue.get()
            url = urllib2.urlopen(host)
            chunk = url.read()
            self.out_queue.put(chunk)
            self.queue.task_done()

class DatamineThread(threading.Thread):
    def __init__(self, out_queue):
        threading.Thread.__init__(self)
        self.out_queue = out_queue

    def run(self):
        while True:
            try:
                chunk = self.out_queue.get()
                soup = BeautifulSoup(chunk)
                print soup.findAll(['title'])
                self.out_queue.task_done()
            except:
                pass

def main():
    for i in range(5):
        t = ThreadUrl(queue, out_queue)
        t.setDaemon(True)
        t.start()

    for host in hosts:
        queue.put(host)

    for i in range(5):
        dt = DatamineThread(out_queue)
        dt.setDaemon(True)
        dt.start()

    queue.join()
    out_queue.join()

if __name__ == "__main__":
    start = time.time()
    main()
    print "Elapsed Time: %s" % (time.time() - start)


执行结果:

wKioL1PZoK2zAAjSAAJ7RxSpJ18475.jpg


    通过该代码您可以看到,我们添加了另一个队列的实例,然后将该队列传递给第一个线程池类ThreadUrl.接下来,对于另一个线程池DatamineThread,几乎复制了完全相同的结构。在这个类的run方法中,从队列中的各个线程获取web页面、文本块,然后使用Beautiful Soup处理这个文本块。在这个实例中,使用Beautiful Soup提取每个页面的title标记、并将其打印输出。可以很容易地将这个实例推广到一些更有价值的应用场景,因为您掌握了基本搜索引擎或者数据挖掘工具的核心内容。一种思想是使用Beautiful Soup从每个页面提取链接,然后按照它们进行导航。


总结:

    本文研究了 Python 的线程,并且说明了如何使用队列来降低复杂性和减少细微的错误、并提高代码可读性的最佳实践。尽管这个基本模式比较简单,但可以通过将队列和线程池连接在一起,以便将这个模式用于解决各种各样的问题。 

    最后,还有很重要的一点需要指出,线程并不能解决所有的问题,对于许多情况,使用进程可能更为合适。特别是,当您仅需要创建许多子进程并对响应进行侦听时,那么标准库子进程模块可能使用起来更加容易。     

--结束END--

本文标题: 使用Python进行线程编程

本文链接: https://www.lsjlt.com/news/191070.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 使用Python进行线程编程
        对于Python来说,并不缺少并发选项,其标准库包括了对线程、进程和异步I/O的支持。在许多情况下,通过创建诸如异步、线程和子进程之类的高层模块,Python简化了各种并发方法的使用。除了标准库之外,还有一些第三方的解决方案。例如T...
    99+
    2023-01-31
    线程 Python
  • 如何进行C++多线程编程?
    如何进行C++多线程编程随着计算机硬件的不断发展,多核处理器已经成为现代计算机的主流。为了充分利用多核处理器的性能,多线程编程成了一个重要的技能。C++是一门强大的编程语言,也提供了很多多线程编程的工具和库。本文将介绍如何进行C++多线程编...
    99+
    2023-11-04
    编程 多线程编程 C++ 多线程
  • 如何进行php多线程编程?
    在现代计算机领域中,多线程并发编程已经成为一种非常常见的编程方式。而在PHP语言中,多线程编程同样也是非常重要的一种技能。本文将向您介绍如何进行PHP多线程编程。什么是多线程编程?多线程编程是指在同一个程序中同时执行多个线程的编程方式。在多...
    99+
    2023-05-22
    编程 PHP 多线程
  • 如何使用VS Code进行Python编程
    本篇文章给大家分享的是有关如何使用VS Code进行Python编程,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Visual Studio Code,简称 VS Code,是...
    99+
    2023-06-17
  • Laravel 中如何使用 Python 进行编程?
    Laravel 是一款流行的 PHP 开发框架,它具有简单易用、高效稳定的特点。Python 是一门广泛应用于科学计算、人工智能等领域的编程语言。那么,如何在 Laravel 中使用 Python 进行编程呢?本文将为你详细介绍。 一、Py...
    99+
    2023-07-19
    unix 编程算法 laravel
  • HTML5中如何进行多线程编程应用
    HTML5中如何进行多线程编程应用,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。HTML5 中工作线程(Web  Worker)简介至 2008 年 W3C 制定出第...
    99+
    2023-06-17
  • Lua中怎么进行多线程编程
    在Lua中进行多线程编程可以使用Lua的Coroutine特性来实现。Coroutine是一种协作式多任务处理方式,可以模拟多线程的...
    99+
    2024-04-09
    Lua
  • 如何在Python编程算法中使用对象进行编程?
    在Python编程中,对象是一种非常重要的概念。通过使用对象,开发者可以更加轻松地编写复杂的算法和数据结构。本文将介绍如何在Python编程算法中使用对象进行编程,并通过代码演示来帮助读者更好地理解。 一、什么是对象? 在Python中,对...
    99+
    2023-10-16
    编程算法 对象 编程算法
  • 《PHP并发编程实战:教你如何使用容器进行多线程编程》?
    PHP并发编程实战:教你如何使用容器进行多线程编程 PHP是一种被广泛使用的服务器端编程语言,其在Web开发领域中有着广泛的应用。但是,由于PHP的单线程特性,它无法同时处理多个请求,这使得在高并发场景下,PHP的性能表现往往不尽如人意。为...
    99+
    2023-10-02
    并发 教程 容器
  • 如何使用Python中的协程进行异步编程
    如何使用Python中的协程进行异步编程在传统的同步编程模型中,一个任务必须等待另一个任务完成后才能继续进行,这样会造成程序的执行效率降低。为了解决这个问题,异步编程模型应运而生。Python中的协程是一种支持异步编程的重要概念,它可以让我...
    99+
    2023-10-28
    Python 协程 异步编程
  • Python并发编程之线程池/进程池
    原文来自开源中国前言python标准库提供线程和多处理模块来编写相应的多线程/多进程代码,但当项目达到一定规模时,频繁地创建/销毁进程或线程是非常消耗资源的,此时我们必须编写自己的线程池/进程池来交换时间空间。但是从Python3.2开始,...
    99+
    2023-06-02
  • 使用 TCell API 进行 TUI 编程
    “纵有疾风来,人生不言弃”,这句话送给正在学习Golang的朋友们,也希望在阅读本文《使用 TCell API 进行 TUI 编程》后,能够真的帮助到大家。我也会在后续的文章中,陆续更新Golang...
    99+
    2024-04-04
  • 使用Kotlin怎么进行编程
    今天就跟大家聊聊有关使用Kotlin怎么进行编程,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Kotlin 基本语法先说个学习Kotlin语法的小窍门,将代码用Java写好,然后Co...
    99+
    2023-05-31
    kotlin
  • 如何进行Python线程的多线程展示
    如何进行Python线程的多线程展示,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。什么多线程?多线程,就是多个独立的运行单位,同时执行同样的事情。想想一下,文章发布后同时被...
    99+
    2023-06-22
  • Python使用Asyncio进行web编程方法详解
    目录前言什么是同步编程什么是异步编程ayncio 版 Hello 程序如何使用 asyncio总结前言 许多 Web 应用依赖大量的 I/O (输入/输出) 操作,比如从网站上下载图...
    99+
    2024-04-02
  • Python进程、线程
    1.线程启动 def run(n): print('%s in thread...'%n) t=threading.Thread(target=run,args=(n,)) t.start #线程等待 t.join 2.多线程同时...
    99+
    2023-01-31
    线程 进程 Python
  • python线程编程
    1、线程模式代码#!/usr/bin/python #_*_coding:utf-8_*_ import threading import time def Producer():     print 'chef : 等人来买包子。。...
    99+
    2023-01-31
    线程 python
  • Python 并发编程中线程与进程的对比:何时使用哪种
    线程与进程:概念和区别 线程是轻量级的执行单元,与进程共享相同的地址空间和资源。它们创建和销毁的速度很快,这使得它们在处理密集型任务时非常高效。然而,线程不能跨越多个 CPU 核心,因为它们受到全局解释器锁 (GIL) 的限制。 进程是...
    99+
    2024-02-18
    Python 并发编程 线程 进程
  • python 多进程和多线程使用详解
    目录进程和线程 Python的多进程 进程池 多进程间的数据通信与共享 Python的多线程 多线程间的数据共享 使用queue队列通信-经典的生产者和消费者模型进程和线程 进程是...
    99+
    2024-04-02
  • Python多线程编程,线程锁
    多线程threading 模块创建线程创建自己的线程类线程通信线程同步互斥方法线程锁@需要了解!!!   什么是线程? 线程也是一种多任务的编程方法,可以利用计算机多核资源完成程序的并发运行。 线程又被称为轻量级进程 ...
    99+
    2023-01-30
    线程 多线程 Python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作