如何用Python将numpy的record数组转换成structured数组?

结构化数组可以转换为 record 数组,这是容易查到的,但是我在 google 上查不到 record 向 structrured 转化,难道全世界没有这种需求?
事情是这样的,我有一个 fits 格式的科学数据表格(非客户个人隐私数据),一百多万行几十列,字符和数字都有。我通过 pyfits 读取后成为 record 数组,想向其中增加几列数据,好像只有结构化数组可以这样操作。大家有什么解决办法么?

暂不考虑 pandas 和 tables,我主要是关心数组格式之间的转换和 record 有没有增加列数据的办法。

谢谢!
如何用Python将numpy的record数组转换成structured数组?


3 回复
import numpy as np

# 创建record数组(numpy.recarray)
rec_arr = np.rec.array([(1, 'Alice', 25.5), 
                        (2, 'Bob', 30.2), 
                        (3, 'Charlie', 22.8)],
                       dtype=[('id', 'i4'), ('name', 'U10'), ('score', 'f4')])

print("原始record数组:")
print(rec_arr)
print(f"类型: {type(rec_arr)}")
print(f"dtype: {rec_arr.dtype}\n")

# 方法1:直接通过dtype转换(最常用)
struct_arr1 = rec_arr.view(np.ndarray).astype(rec_arr.dtype)
print("方法1转换结果:")
print(struct_arr1)
print(f"类型: {type(struct_arr1)}")
print(f"dtype: {struct_arr1.dtype}\n")

# 方法2:使用np.array()构造函数
struct_arr2 = np.array(rec_arr, dtype=rec_arr.dtype)
print("方法2转换结果:")
print(struct_arr2)
print(f"类型: {type(struct_arr2)}\n")

# 方法3:通过复制数据(保留结构化类型)
struct_arr3 = rec_arr.copy().view(np.ndarray)
print("方法3转换结果:")
print(struct_arr3)
print(f"类型: {type(struct_arr3)}\n")

# 验证数据一致性
print("数据一致性验证:")
print(f"所有方法数据相等: {np.array_equal(struct_arr1, struct_arr2) and np.array_equal(struct_arr2, struct_arr3)}")
print(f"字段访问测试 - struct_arr1['name']: {struct_arr1['name']}")

# 关键区别说明
print("\n--- 核心区别 ---")
print("recarray: 可以直接用属性访问字段,如 rec_arr.name")
print("structured array: 只能用字典式访问,如 struct_arr1['name']")
print("转换本质: recarray是structured array的子类,转换主要是类型降级")

核心要点:

  • recarraystructured array的子类,多了属性访问功能(如arr.name
  • 转换实质是去掉recarray的额外功能,回归基础ndarray类型
  • 三种方法效果相同,方法1(view().astype())最常用且高效

一句话建议:.view(np.ndarray).astype(原dtype)最直接。


文档里面有:

arr2 = recordarr.view(recordarr.dtype.fields or recordarr.dtype, np.ndarray)

但是添加列应该需要复制所有数据。

非常感谢!是的,numpy.lib.recfunctions 就是通过复制数组实现的 structrued 增加列

回到顶部