现在时间是:
当前位置:首 页 >> 数据分析>> 文章列表

Pandas 几个处理的细节

作者:   发布时间:2016-04-05 12:52:14   浏览次数:2083

# 在原有表单上新增一列的几种操作方法

re_need.loc[:,'距离0']=0.001
re_need.ix[:,'距离0']= 0.001
re_need.assign(距离0 = 0.001)
re_need # 证明三种方法都是可以的


#增加行的方法,采用append,就和列表的操作一样(暂时没有用到)


# 对新建列进行赋值时,必须采用LOC进行位置引用,后再赋值,否则会出现SettingWithCopyWarning的警告
disn =[]
for adn in range(len(re_need2['地址0'])):
disn.append(float(getDistanceFromXtoY(my_lbs, re_need2['坐标0'][adn]))) # 默认插入的是字符串,字符串的排序和数字排序是不同的
re_need2.loc[:,'距离0'] = disn #并不是新建列出现的错误,而是由于重新给列表赋值出现的错误,所以有用LOC进行位置引用,后更改
re_need2.sort_values(by='距离0') # 排序显示正常


# 利用map进行映射,生成新的时间序列,要和原序列进行组合是采用连接命令,可以用axis=1指定以列进行连接(扩展)
inf5= data_supply['内容'].map(info_lbs)
re_supply = pd.concat([data_supply,inf4,inf5],axis=1)



#虽然 DataFrame 支持 Python/Numpy 的索引语法,但是推荐使用 .at, .iat, .loc, .iloc 和 .ix 方法进行索引

会以上的一两种索引方法看来是必须的!








上一篇:没有了    下一篇:没有了

Copyright ©2018    易一网络科技|www.yeayee.com All Right Reserved.

技术支持:自助建站 | 领地网站建设 |短信接口 版权所有 © 2005-2018 lingw.net.粤ICP备16125321号 -5