Python中多进程编程时全局变量的地址问题如何解决？

import multiprocessing
import os

g_task=[“task”]

def task1():
g_task.append(“task1”)
print("–task1–进程 id=%d—g_task=%s----g_task 的 id=%d" % (os.getpid(), g_task, id(g_task)))

def task2():
g_task.append(“task2”)
print("–task2–进程 id=%d—g_task=%s----g_task 的 id=%d" % (os.getpid(), g_task, id(g_task)))

def main_task():
g_task.append(“main_task”)
print("–main_task–进程 id=%d—g_task=%s----g_task 的 id=%d" % (os.getpid(), g_task, id(g_task)))

if name == ‘main’:
p1 = multiprocessing.Process(target=task1)
p1.start()
p1.join()

p2 = multiprocessing.Process(target=task2)
p2.start()
p2.join()

main_task()

为什么在 linux 中 id(g_task)这个地址相同而在 windows 中 id(g_task)地址却不同呢？
Python中多进程编程时全局变量的地址问题如何解决？

bupafengyu 1楼

不同是正常的，相同是“碰巧”的。理解多进程和多线程的区别就应该懂了。

sinazl 2楼

在Python多进程编程中，每个子进程都会复制父进程的内存空间，因此全局变量在子进程中实际上是独立的副本，而不是共享的同一内存地址。如果你需要在多个进程间共享数据，可以使用multiprocessing模块提供的共享内存机制。

这里是一个使用multiprocessing.Value和multiprocessing.Array来共享数据的例子：

import multiprocessing

def worker(shared_value, shared_array, index):
    # 修改共享的值
    shared_value.value += 1
    # 修改共享的数组
    shared_array[index] = index * 10

if __name__ == '__main__':
    # 创建一个共享的整数值，类型为'i'（整数），初始值为0
    shared_value = multiprocessing.Value('i', 0)
    # 创建一个共享的数组，类型为'i'，长度为5
    shared_array = multiprocessing.Array('i', 5)

    processes = []
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(shared_value, shared_array, i))
        processes.append(p)
        p.start()

    for p in processes:
        p.join()

    print(f"共享值的结果: {shared_value.value}")
    print(f"共享数组的结果: {list(shared_array)}")

这段代码演示了如何在多个进程间共享一个整数和一个数组。注意，multiprocessing.Value和multiprocessing.Array使用了锁来确保数据的一致性，但在复杂场景下你可能需要额外的同步机制。

总结：用multiprocessing提供的共享内存对象来解决。

bupafengyu 3楼

因为 linux 下的 multiprocessing 用的是 fork，fork 后的进程跟父进程完全一致，所以 id 号一样； windows 下的实现有所区别。

vueper 4楼

linux 下用 fork，所以并不改变原来的虚拟地址，而 win 下用的是重启一个新的 python.exe ，所以所有的变量都重新初始化了

nodeper 5楼

如上，原因是 2 种系统对多进程的实现有区别。
另外，linux 上列表 g_task 的表现（全局变量地址一样）很容易让人感觉到进程间居然共享内存空间，打印结果表明并不是，实际只是复制了一份地址过去？联想到深拷贝（拷贝后列表 id 不同）、浅拷贝（拷贝后列表中子对象还是同一个，测试发现多进程中也不是）。好奇多进程这里的全局变量 list 是怎么实现的？
最后，官方不建议这么玩，进程间通信、共享数据的方法有很多介绍。

phonegap100 6楼

首先，运行在用户空间的程序所拿到的内存地址，都不是真实的物理内存地址。我们它所在的地址空间叫做 user virtual address space，这些地址是通过内存管理单元（ MMU ）来对应真实的物理地址。所以当你的程序被系统加载执行后，所获得的指针地址全都是针对你自身的虚拟地址。A 和 B 两个程序的 0x1111 地址，可能指向同一个物理内存地址，也可能指向不同的物理内存地址。同理，A 的 0x1111 和 B 的 0x2222 也可能指向同一个物理内存地址（共享内存）。

所以，这里的 g_task 在 A 和 B 两个不同的 process 观测到指向同一地址，并不能说明什么。可以运行楼主的例子，在 process Ａ中对ｇ_task 进行的修改，并不能在 process B 中观测到。之所以他们内存地址相同，只是因为 Linux 使用 fork 实现让他们"碰巧"相同了而已。

zlyuanteng 7楼

学习了！
补了下 fork 的内容，看看理解的对不对。fork 之后的ｇ_task 在子进程中“某一阶段”是共享的同一真实物理内存，virtual address 是一样的，对应的物理地址也是一样的，但是子进程会有自己独立的新内存空间。由于 Copy-on-Write 机制，只有在子进程发生对 g_task 的修改操作时，才会在子进程独立内存空间为 g_task 重新分配新空间，此时继承自父进程的 virtual address 仍然都不变，但物理地址都变了。

caililin 8楼

是的，可以这么理解。