论坛首页 AI安全讨论区 阅读主题

[原创]机器学习基础-特征工程1

51 浏览 2 回复
#1 楼主 2026-06-01 21:08:58
在机器学习建模中,特征最终必须是数字形式,但原始特征可以是各种类型(文本、类别、图像等)。让我用通俗易懂的金融风控例子一步步解释:

1 ,为什么需要数字形式?
机器学习模型本质是数学公式(如 y = ax + b),只能处理数字。
例子:判断贷款风险时,模型需要计算:

年龄(30岁 → 数字30)
职业("教师" → 需转换为数字)
信用记录("良好"/"差" → 需转换为数字)


2,非数字特征如何转换?

情况1:类别特征(如职业、学历) 独热编码(One-Hot Encoding)
例子:职业特征

原始数据:["教师", "程序员", "教师", "销售"]
转换后:


职业_教师
职业_程序员
职业_销售

---
来源: 看雪论坛
原文链接: https://bbs.kanxue.com/thread-288476.htm
#2 2026-06-01 21:08:58
good
#3 2026-06-01 21:08:58
good

请登录后参与讨论

立即登录 注册账号