pandas使用pivot时遇到Index contains duplicate entries, cannot reshape

原始数据样例如下:

1
2
3
4
date code count
20170801 000001 10
20170802 000002 20
20170803 000001 30

使用pivot处理数据,命令如下:

df.pivot(index=’date’,columns=’code’,values=’count’)

执行后报错信息:

ValueError: Index contains duplicate entries, cannot reshape

说明column有重复信息,使用如下命令检查重复列内容:

1
2
df = df.sort_values(['date','code','count'],ascending=[1,1,0])
df = df[(df['code'] == df['code'].shift(1)) | (df['code'] == df['code'].shift(-1))]

发现code列有哪些重复数据

eryk wechat
欢迎您扫一扫上面的微信公众号,订阅我的博客!
坚持原创技术分享,您的支持将鼓励我继续创作!
eryk WeChat Pay

WeChat Pay

eryk Alipay

Alipay