0%

pandas使用pivot时遇到Index contains duplicate entries, cannot reshape

原始数据样例如下:

date        code    count
20170801    000001      10
20170802    000002      20
20170803    000001      30

使用pivot处理数据,命令如下:

df.pivot(index=‘date’,columns=‘code’,values=‘count’)

执行后报错信息:

ValueError: Index contains duplicate entries, cannot reshape

说明column有重复信息,使用如下命令检查重复列内容:

df = df.sort_values(['date','code','count'],ascending=[1,1,0])
df = df[(df['code'] == df['code'].shift(1)) | (df['code'] == df['code'].shift(-1))]

发现code列有哪些重复数据

Python量化交易实战
欢迎您扫码订阅我的微信公众号: pyquant
坚持原创技术分享,您的支持将鼓励我继续创作!

欢迎关注我的其它发布渠道