意见箱
恒创运营部门将仔细参阅您的意见和建议,必要时将通过预留邮箱与您保持联络。感谢您的支持!
意见/建议
提交建议

pandas字符串映射成数字的方法及代码是什么

来源:恒创科技 编辑:恒创科技编辑部
2023-12-27 02:57:59
这篇文章主要讲解了“pandas字符串映射成数字的方法及代码是什么”,文中的讲解内容简单、清晰、详细,对大家学习或是工作可能会有一定的帮助,希望大家阅读完这篇文章能有所收获。下面就请大家跟着小编的思路一起来学习一下吧。


pandas字符串映射成数字的方法及代码是什么

目录
pandas 将字符串映射为数字 pandas 将某一列的字符值转换为数字

pandas 将字符串映射为数字

在有些数据集中,有些数据变量用字符串表示,但为了方便处理,往往想转换为好处理的格式,这时候不一定要用one hot进行编码,也可以直接转成整数:

test_df["xx"] = pd.factorize(test_df["xx"])[0].astype(int)

但是这样映射的数字是从0开始的,如果有初始要求,可以对映射结果加上某个值,例如,把从0开始变为从15开始:

test_df["xx"] = test_df["xx"].add(15)

效果gift_cards["user_id"] = pd.factorize(gift_cards["user_id"])[0].astype(int):

user_id item_id ratings time
0 B001GXRQW0 APV13CM0919JD 1.0 1229644800
1 B001GXRQW0 A3G8U1G1V082SN 5.0 1229472000
2 B001GXRQW0 A11T2Q0EVTUWP 5.0 1229472000
3 B001GXRQW0 A9YKGBH3SV22C 5.0 1229472000
4 B001GXRQW0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 B01H5PPJT4 A2K9WVQW9TLWNK 5.0 1536969600
147190 B01H5PPJT4 A149ALSR6TPGF7 4.0 1536278400
147191 B01H5PPJT4 A2Q066NZCQSCOR 5.0 1535500800
147192 B01H5PPJT4 A1KJLWCW7XBS8I 5.0 1534550400
147193 B01H5PPJT4 ANABUB0FRZXRM 5.0 1534204800

user_id item_id ratings time
0 0 APV13CM0919JD 1.0 1229644800
1 0 A3G8U1G1V082SN 5.0 1229472000
2 0 A11T2Q0EVTUWP 5.0 1229472000
3 0 A9YKGBH3SV22C 5.0 1229472000
4 0 A34WZIHVF3OKOL 1.0 1229472000
... ... ... ... ...
147189 858 A2K9WVQW9TLWNK 5.0 1536969600
147190 858 A149ALSR6TPGF7 4.0 1536278400
147191 858 A2Q066NZCQSCOR 5.0 1535500800
147192 858 A1KJLWCW7XBS8I 5.0 1534550400
147193 858 ANABUB0FRZXRM 5.0 1534204800

pandas 将某一列的字符值转换为数字

使用map的方法就可以实现把某一列的字符类型的值转换为数字。

class_mapping = {'A':0, 'B':1}
data[class] = data[class].map(class_mapping)

首先定义一个字典,然后使用map方法就可以把某一列的字符类型的值转换为数字。

好了,这就是对使用pandas把某一列的字符值转换为数字的认识。


到此这篇关于“pandas字符串映射成数字的方法及代码是什么”的文章就介绍到这了,更多相关内容请搜索恒创科技以前的文章或继续浏览下面的相关文章,希望大家以后多多支持恒创科技!
上一篇: 【电力】永磁同步电机-自抗扰控制PMSM ADRC附matlab代码 下一篇: Python共现矩阵的定义是什么,怎样实现