请教Python机器学习中SMOTE过采样算法的报错问题

在做数据分析过程中给 Anaconda 导入 smote 的包后，使用 SMOTE 的 fit_resample 属性时报错 AttributeError: ‘SMOTE’ object has no attribute ‘fit_resample’。具体情况如下：

from imblearn.over_sampling import SMOTE
smote = SMOTE()
good_train, good_target = smote.fit_resample(X, y)

AttributeError Traceback (most recent call last)
<ipython-input-4-e244f10f9936> in <module>
1 smote = SMOTE()
----> 2 good_train, good_target = smote.fit_resample(X, y)

AttributeError: ‘SMOTE’ object has no attribute 'fit_resample’

百度了也没有找到答案哇，希望有大神可以帮忙解决一下 /(ㄒoㄒ)/~~
请教Python机器学习中SMOTE过采样算法的报错问题

h691938207 1楼

看一下 imblearn 版本，我的 0.5.0 版本没问题，如果版本过低可以升级下看看

vueper 2楼

帖子回复：

遇到SMOTE报错，最常见的原因是数据预处理没做好。SMOTE要求输入必须是纯数值型数据，不能有字符串或缺失值。先检查你的特征矩阵 X 和目标向量 y：

import pandas as pd
from sklearn.preprocessing import LabelEncoder
from imblearn.over_sampling import SMOTE

# 假设你的数据是df，目标是target列
# 1. 分离特征和目标
X = df.drop('target', axis=1)
y = df['target']

# 2. 处理非数值特征：使用LabelEncoder或OneHotEncoder
le = LabelEncoder()
for col in X.select_dtypes(include=['object']).columns:
    X[col] = le.fit_transform(X[col])

# 3. 处理缺失值（SMOTE不能有NaN）
X = X.fillna(X.mean())  # 或用其他填充方式

# 4. 确认y是整数标签（分类问题）
y = y.astype(int)

# 5. 应用SMOTE
smote = SMOTE(random_state=42)
X_resampled, y_resampled = smote.fit_resample(X, y)

如果还报错，可能是版本问题，确保安装了正确版本的imbalanced-learn：

pip install imbalanced-learn==0.10.1

另一个常见错误是数据维度不匹配，检查 X.shape 和 y.shape 是否一致。如果目标类别样本数太少（比如某个类别只有1个样本），SMOTE也会失败，这时需要先确保每个类别至少有2个样本。

总结建议：先确保数据干净且全为数值。

eggper 3楼

谢谢啦~我的版本是 0.3.1，尝试升级不过用 pip 和 conda 升级都失败了 /(ㄒoㄒ)/~~

然后我查了一下官方文档，用 fit_sample 好使了，效果和 fit_resample 一样。所以应该就是版本问题啦。

btw，可以看看升级失败的解决办法咩~感谢~

pip 失败原因：’ Could not find a version that satisfies the requirement mblearn (from versions: )
No matching distribution found for mblearn ‘

conda 失败原因：’ PackageNotInstalledError: Package is not installed in prefix.
prefix: D:\softwares\myAnaconda
package name: imblearn ‘

yibo5220 4楼

pip 失败原因：mblearn 是不是输错了，是imblearn才对吧

bupafengyu 5楼

啊啊啊对对😂改过来了虽然还是升不了但是先不管了能用就行😂